Doculayer.ai, leverancier van Intelligente Document Processing (IDP) software voor het analyseren en geautomatiseerd verwerken van documentstromen op basis van AI-technologie, ziet dit jaar zes belangrijke trends die dominant zijn op het gebied van intelligente documentverwerking.
1. Gebruik van pre-trained modellen
Dit jaar zullen steeds meer leveranciers zogenaamde pre-trained machine learning modellen gaan inzetten voor intelligente documentverwerking. Het gebruik van pre-trained modellen kan de implementatietijd van IDP-oplossingen verkorten als de data gebruikt voor training veel overeenkomsten heeft met de klant-situatie. IDP-oplossingen zijn al populair in de VS en leveranciers uit de VS proberen ook hun oplossingen in Europa te verkopen.
Pre-trained modellen voor diverse verticale markten bieden veel nieuwe mogelijkheden om met IDP-oplossingen een snellere ROI te behalen. Kanttekening daarbij is wel dat veel modellen met name gericht zijn op de Amerikaanse markt en de daar gebruikte documenten. Dat betekent dat deze modellen in Europa met andere bedrijfsprocessen, meer variatie in documenttypes en andere talen niet goed bruikbaar zijn.
Volgens Richard Smit, oprichter en CTO bij Doculayer.ai, zal het simpelweg kopiëren van Amerikaanse modellen voor de Europese markt niet voldoen voor de meeste Europese use cases. “Het opnieuw trainen van een lokaal model voor een specifieke use case kan afhankelijk van de benodigde hoeveelheid trainingsdata alsnog veel inspanning vergen. Onze ervaring leert dat juist het combineren van ML-modellen met logica in de vorm van bedrijfsregels, patronen en scripting vaak betere resultaten geeft met minder trainingsdata en in minder tijd.”
2. Meer pre-built use cases
In het komend jaar kunnen klanten nog meer pre-built use cases verwachten. Voor bepaalde use cases is dan een complete inrichting beschikbaar waardoor de doorlooptijd aanzienlijk wordt verkort. Pre-trained ML-modellen, komen hier uitstekend bij van pas. Wel is het essentieel dat het bij-trainen van pre-trained modellen mogelijk is zodat de behaalde resultaten indien nodig te verbeteren zijn.
3. Transfer learning in opkomst
Om IDP-oplossingen sneller in gebruik te kunnen nemen, wordt vaker gebruik gemaakt van transfer learning. Daarbij wordt een bestaand Machine Learning (ML)-model gebruikt voor het trainen van een nieuw model daarbij aangevuld met additionele trainingsdata om uiteindelijk betere resultaten te behalen.
Bedrijven kunnen in 2022 ook via ‘cross training’ sneller en efficiënter ML-modellen ontwikkelen. Hierbij wordt branchekennis en met name data door verschillende bedrijven verzameld en gedeeld. Zo kunnen ML-modellen met een gezamenlijke inspanning ontwikkeld worden en profiteren meerdere bedrijven van een ML-model voor een branche. Bedrijven kunnen deze modellen vervolgens aanpassen aan de specifieke klantbehoeften.
4. Waardevolle menselijke expertise beter ondersteund door IDP-oplossingen
Inhoudelijke (proces) experts hebben diepgaande kennis van document gerelateerde processen en het type documenten dat gebruikt wordt binnen een organisatie. Om hun kennis beter te gebruiken, zullen er in IDP-oplossingen steeds vaker review- en feedbackmogelijkheden geïmplementeerd worden. Hierbij kunnen experts de automatische classificaties en geëxtraheerde data verifiëren en eventuele correcties doorvoeren of de resultaten bevestigen. Van belang hierbij is dat de oplossing een gebruikersvriendelijke user interface biedt, afgestemd op het soort gebruiker zodat deze ook te gebruiken is voor medewerkers zonder technische achtergrond.
5. Het belang van het beschermen van gevoelige (persoons)gegevens neemt toe
Functionaliteit voor gegevensbescherming in IDP-oplossingen wordt belangrijker in 2022. Nu digitale transformatie in steeds meer sectoren plaatsvindt, zijn steeds meer documenten digitaal beschikbaar. Daardoor kunnen ze makkelijker worden opgeslagen en gedeeld. Het bieden van functionaliteit voor het goed beschermen van de privacygevoelige gegevens die in deze digitale documenten staan, wordt een belangrijk aandachtspunt in 2022.
Smit: “Het beschermen van gevoelige gegevens start met functionaliteit voor het kunnen detecteren ervan in documenten. Vervolgens is het zaak dat deze gegevens geanonimiseerd of zelfs gepseudonimiseerd kunnen worden afhankelijk van de rol of de functie van de medewerker die ze raadpleegt. De laatste stap is dat er een geanonimiseerde versie kan worden gemaakt voor de distributie van een document. Doculayer.ai beschikt al geruime tijd over deze functionaliteit omdat we hier al vroegtijdig op hebben ingezet.”
6. Verschuiving naar nieuwe betaalmodellen
In het verleden betaalden bedrijven vaak voor documentverwerking software op basis van ingeschatte servercapaciteit. In 2022 veranderen deze betaalmodellen steeds meer. Betalen naar gebruik wordt populairder. Bedrijven kunnen dan bijvoorbeeld betalen per pagina die door de software verwerkt wordt. Dit verlaagt de instapdrempel voor de middelgrote bedrijven en maakt het voor hen ook eenvoudiger de kosten per afdeling te verdelen.
Richard Smit: “Mede door de pandemie zagen we in 2021 dat steeds meer bedrijven werk maakten van digitale transformatie. Het intelligent verwerken van ongestructureerde documenten is daar steeds vaker onderdeel van. Bij financiële instellingen was deze trend al gaande maar nu zien we dat deze belangstelling zich uitbreidt naar andere sectoren zoals de gezondheidszorg, de pharmaceutische industrie, de logistiek en de overheid. Daarom verwachten wij dat de vraag naar intelligente oplossingen voor het verwerken van documenten dit jaar verder zal stijgen.”
7 november (online seminar op 1 middag)Praktische tutorial met Alec Sharp Alec Sharp illustreert de vele manieren waarop conceptmodellen (conceptuele datamodellen) procesverandering en business analyse ondersteunen. En hij behandelt wat elke data-pr...
11 t/m 13 november 2024Praktische driedaagse workshop met internationaal gerenommeerde trainer Lawrence Corr over het modelleren Datawarehouse / BI systemen op basis van dimensioneel modelleren. De workshop wordt ondersteund met vele oefeningen en pr...
18 t/m 20 november 2024Praktische workshop met internationaal gerenommeerde spreker Alec Sharp over het modelleren met Entity-Relationship vanuit business perspectief. De workshop wordt ondersteund met praktijkvoorbeelden en duidelijke, herbruikbare ...
26 en 27 november 2024 Organisaties hebben behoefte aan data science, selfservice BI, embedded BI, edge analytics en klantgedreven BI. Vaak is het dan ook tijd voor een nieuwe, toekomstbestendige data-architectuur. Dit tweedaagse seminar geeft antwoo...
De DAMA DMBoK2 beschrijft 11 disciplines van Data Management, waarbij Data Governance centraal staat. De Certified Data Management Professional (CDMP) certificatie biedt een traject voor het inleidende niveau (Associate) tot en met hogere niveaus van...
3 april 2025 (halve dag)Praktische workshop met Alec Sharp [Halve dag] Deze workshop door Alec Sharp introduceert conceptmodellering vanuit een non-technisch perspectief. Alec geeft tips en richtlijnen voor de analist, en verkent datamodellering op c...
10, 11 en 14 april 2025Praktische driedaagse workshop met internationaal gerenommeerde spreker Alec Sharp over herkennen, beschrijven en ontwerpen van business processen. De workshop wordt ondersteund met praktijkvoorbeelden en duidelijke, herbruikba...
15 april 2025 Praktische workshop Datavisualisatie - Dashboards en Data Storytelling. Hoe gaat u van data naar inzicht? En hoe gaat u om met grote hoeveelheden data, de noodzaak van storytelling en data science? Lex Pierik behandelt de stromingen in ...
Deel dit bericht