Magic Software Benelux
AI-chatbot voor documentbeheer: van blob tot begrip
Voor Magic Software Benelux ontwikkelden we een Proof of Value voor een AI-gedreven chatbot die documenten uit blob-velden in een SQL-database kan analyseren en vragen in natuurlijke taal beantwoordt. De bot haalt relevante antwoorden uit klantdocumentatie — van gescande PDF's tot Word-bestanden — en maakt deze informatie voor het eerst echt toegankelijk.
De uitdaging
Magic Software beschikte over grote hoeveelheden klantdocumentatie opgeslagen in ongestructureerde blob-velden binnen hun SQL-database. Deze documenten, vaak gescand of in verschillende bestandsformaten, waren moeilijk doorzoekbaar. Klanten konden geen gerichte vragen stellen over de inhoud en medewerkers besteedden veel tijd aan het handmatig zoeken naar relevante informatie.
Aanpak
Explore
Infrastructuur en documentextractie
In de eerste fase lag de focus op het ontwikkelen van een werkende infrastructuur voor documentextractie. Er werden testdatabases gebouwd en OCR ingezet om gescande documenten om te zetten naar doorzoekbare tekst. We onderzochten hoe de bestaande SQL-database het beste ontsloten kon worden.
Prove
Chunking, embeddings en RAG-architectuur
We ontwikkelden functionaliteiten om tekst op te splitsen in betekenisvolle stukken (chunking) en met behulp van embeddings te indexeren. Een AI-model gebaseerd op Mistral met RAG-architectuur werd ingezet om documenten te doorzoeken. De chatbot werd geoptimaliseerd voor het Nederlands.
Build
Integratie, performance en testing
De chatbot werd gekoppeld aan een Angular-interface voor een soepele gebruikerservaring. Het AI-model werd als snapshot opgeslagen om laadtijd te minimaliseren. Samen met de opdrachtgever werd de software getest op een VM-serveromgeving bij Magic in Zevenaar, inclusief ondersteuning voor meerdere documenttypes zoals .doc-bestanden.
Sustain
Documentatie en overdracht
Er werd uitvoerig getest op nauwkeurigheid, snelheid en bruikbaarheid. Het werk werd duidelijk gedocumenteerd met een uitgebreide README en inline documentatie op GitHub, zodat Magic het prototype zelfstandig kan doorontwikkelen.
Impact
Van ontoegankelijke blob-velden naar conversationele toegang tot klantinformatie.
- Werkend prototype dat documenten uit SQL-databases analyseert en natuurlijke taalvragen beantwoordt.
- Relevante antwoorden op basis van documentinhoud, snel dankzij model-optimalisaties.
- Toegankelijk via een gebruiksvriendelijke webinterface.
- Bewijs dat AI ingezet kan worden om klantinformatie te ontsluiten binnen bestaande IT-infrastructuren.
- Hands-on ervaring voor student Eddi met moderne AI-technieken, software-integratie en klantcommunicatie.
Technologie & Tags