De wereld van data is de afgelopen jaren sterk in ontwikkeling. Zeker met de opkomst van kunstmatige intelligentie in allerlei verschillende vormen zal deze ontwikkeling de komende jaren alleen nog maar meer versnellen. Dat maakt het dan ook lastig om te voorspellen wat er op ons af gaat komen.
Om ons daarin te helpen heeft Qlik hun trendwatcher Dan Sommer gevraagd wat de top-10 trends in data en AI zijn. Hij maakte daarover onder andere dit webinar. Het webinar is het kijken waard, maar in dit blog loopt Senior Consultant Lennaert van den Brink je door de tien trends heen en bekijkt wat deze trends voor jou betekenen.
De 5 V’s
De uitdagingen die horen bij Big Data worden traditioneel omschreven door de zogeheten 3 V’s: Volume, Velocity en Variety.
Volume verwijst naar de hoeveelheid data. Grotere volumes van data vragen om een ander soort opslag. De doorsnee harde schijf van een server is niet voldoende om de terabytes aan data op te slaan die horen bij Big Data.
Velocity gaat over de verwerkingssnelheid. De grote hoeveelheid data doorrekenen kost tijd. Hoe groter het datavolume hoe langer het verwerken kan duren. De uitdagingen die geassocieerd worden met Volume en Velocity zijn dan ook een belangrijke reden waarom zo veel organisaties tegenwoordig gebruik maken van de verschillende Cloud providers. Het is niet meer realistisch om de nodige rekenkracht zelf op te bouwen in het serverhok van je magazijn.
Variety gaat over de verschillende vormen die data aan kan nemen. Waar vroeger bijna alle data de vorm van gestructureerde tabellen had heb je tegenwoordig ook allerlei ongestructureerde data, zoals foto’s en video’s, maar ook in de vorm van bijvoorbeeld Tweets en andere social media berichten. Generatieve AI, zoals bijvoorbeeld ChatGPT, zal er voor gaan zorgen dat ongestructureerde data steeds beter en eenvoudiger te gebruiken is in allerlei bedrijfsprocessen.
Naast de traditionele 3V’s stelt Dan Sommer voor om twee nieuwe V’s te introduceren: Validity en Value. Validity gaat over de betrouwbaarheid van data. Data komt tegenwoordig uit veel verschillende bronnen en wordt door allerlei mensen en machines op verschillende niveaus verwerkt. Als we moeten gaan vertrouwen op onze data, dan is het van essentieel belang dat we snappen waar onze data vandaan komt en hoe het tot stand is gekomen.
Value gaat over de waarde die de data kan vertegenwoordigen. Niet alleen kan data waarde hebben omdat het ons inzicht geeft in de performance van onze KPI’s, in de nabije toekomst zullen we steeds vaker gaan zien dat data ook als product verkocht zal worden. Grote techbedrijven zoals Facebook en Google hebben hier al een verdienmodel van gemaakt, zij verkopen data over hun gebruikers aan adverteerders, maar ook op kleinere niveaus zal de handel in goede, kwalitatieve waarde steeds meer toenemen. Dit effect wordt extra versterkt door de opkomst van generatieve AI en Large Language Models (LLMs). De huidige LLM’s zijn vooral generiek. Ze zijn getraind op grote hoeveelheden generieke data. De volgende stap zal echter zijn om dergelijke modellen te fine-tunen voor jouw specifieke context. Denk bijvoorbeeld aan een ChatGPT achtige toepassing die volledig getraind is op alle documentatie en software code die in jouw bedrijf is geschreven. Heb je als bedrijf echter nog niet zo veel kwalitatief goede documentatie of code dan kan het aantrekkelijk zijn dergelijke data van een externe partij in te kopen.
Wat betekent dit voor jouw bedrijf
Net als met de voorgaande data trends zal ook dit keer niet iedereen gelijk all-in gaan door grote AI-projecten op te starten in zijn of haar organisatie. Toch is het wel verstandig om nu al in te spelen op de trends. Zo is het verstandig om nu al aan de slag te gaan met de kwaliteit van jouw data. Een goede datakwaliteit was al belangrijk voor de bestaande BI-rapportages en dashboards, maar het belang gaat alleen nog maar groter worden. Gelukkig schreven we eerder al een blog over hoe je aan de slag kunt gaan met datakwaliteit in jouw organisatie
Ongestructureerde data
Daarnaast is het goed om te beseffen dat ongestructureerde data steeds beter te gebruiken wordt. Op dit moment kan je misschien nog niet zo heel eenvoudig waarde halen uit documenten, foto’s, video’s en tweets, maar het gaat niet lang meer duren voordat er kant-en-klare toepassingen komen. Denk dus nu alvast na over welke ongestructureerde data je misschien nog niet vast legt, maar waar misschien wel nuttige inzichten uit te halen zijn. Door nu vast te beginnen met gestructureerde opslag van dit soort data kun je straks mee met de golf aan nieuwe toepassingen.
Data professionals
Tot slot laten de trends zien dat er heel wat gaat veranderen op het vlak van data professionals. De grenzen tussen rollen als data engineer, data scientist en data analist zullen steeds meer gaan vervagen en ook zullen er steeds meer data en AI-vaardigheden worden gevraagd van alle medewerkers op alle niveaus. Het is dus waarschijnlijk slim om jouw collega’s nu al te vragen om hun vaardigheden op data gebied aan te scherpen. Niet alleen op technisch vlak, maar bijvoorbeeld ook op het gebied van wet- en regelgeving is het noodzakelijk dat er voldoende kennis in huis is om op een veilige en verantwoorde manier om te kunnen gaan met alle nieuwe mogelijkheden die geboden worden.
7 november (online seminar op 1 middag)Praktische tutorial met Alec Sharp Alec Sharp illustreert de vele manieren waarop conceptmodellen (conceptuele datamodellen) procesverandering en business analyse ondersteunen. En hij behandelt wat elke data-pr...
11 t/m 13 november 2024Praktische driedaagse workshop met internationaal gerenommeerde trainer Lawrence Corr over het modelleren Datawarehouse / BI systemen op basis van dimensioneel modelleren. De workshop wordt ondersteund met vele oefeningen en pr...
18 t/m 20 november 2024Praktische workshop met internationaal gerenommeerde spreker Alec Sharp over het modelleren met Entity-Relationship vanuit business perspectief. De workshop wordt ondersteund met praktijkvoorbeelden en duidelijke, herbruikbare ...
26 en 27 november 2024 Organisaties hebben behoefte aan data science, selfservice BI, embedded BI, edge analytics en klantgedreven BI. Vaak is het dan ook tijd voor een nieuwe, toekomstbestendige data-architectuur. Dit tweedaagse seminar geeft antwoo...
De DAMA DMBoK2 beschrijft 11 disciplines van Data Management, waarbij Data Governance centraal staat. De Certified Data Management Professional (CDMP) certificatie biedt een traject voor het inleidende niveau (Associate) tot en met hogere niveaus van...
3 april 2025 (halve dag)Praktische workshop met Alec Sharp [Halve dag] Deze workshop door Alec Sharp introduceert conceptmodellering vanuit een non-technisch perspectief. Alec geeft tips en richtlijnen voor de analist, en verkent datamodellering op c...
10, 11 en 14 april 2025Praktische driedaagse workshop met internationaal gerenommeerde spreker Alec Sharp over herkennen, beschrijven en ontwerpen van business processen. De workshop wordt ondersteund met praktijkvoorbeelden en duidelijke, herbruikba...
15 april 2025 Praktische workshop Datavisualisatie - Dashboards en Data Storytelling. Hoe gaat u van data naar inzicht? En hoe gaat u om met grote hoeveelheden data, de noodzaak van storytelling en data science? Lex Pierik behandelt de stromingen in ...
Deel dit bericht