Tijdens de Big Data Expo, die plaats vond op 30 september en 1 oktober, was Rick van der Lans voorzitter van keynote zaal A en hield beide dagen een presentatie. Op donderdag 1 oktober weerlegde hij zes mythes omtrent big data.
Big data is geen doel. Niemand gaat zomaar een database bouwen om data te structuren alleen om het bouwen ervan. De database wordt gebouwd voor een ander doel, namelijk het analyseren van de data in de database. Big data geeft een antwoord. Specifieker gezegd, big data geeft een antwoord op vragen voortkomend uit analytics. Men begint dus altijd met analytics.
Voor analytics heb je niet altijd big data nodig. Voor sommige vraagstukken heb je genoeg aan weinig data. Kwaliteit moet altijd de belangrijkste reden zijn voor de keuze aan het type en de hoeveelheid data die gebruikt wordt.
Dit is niet altijd waar, er zijn namelijk ook SQL databases die Petabytes aan data kunnen verwerken. Daarnaast is er geen duidelijke grens vanaf wanneer iets big data genoemd wordt. Wat tegenwoordig steeds vaker voorkomst is het fenomeen polyglot persistentie. In dit geval slaat een gebruiker data in verschillende databaseproducten op, gesorteerd op de soort analytics die ze erop willen toepassen. Verschillende databronnen worden in verschillende databasesystemen opgeslagen die het beste bij deze data past, bijvoorbeeld SQL of geen SQL. Daarnaast kan de combinatie ook makkelijk aangepast worden aan de wensen van de en een combinatie die het best bij de wensen van de gebruiker past, bijvoorbeeld zo goedkoop of zo flexibel mogelijk.
Deze mythe is nooit onderbouwd door onderzoek, en mensen die het noemen gebruiken geen referentie of verwijzen naar een ander artikel wat ook geen bron heeft voor deze uitspraak. We weten dus helemaal niet of dit waar is, maar wat we wel weten is dat door de groei van Internet of Things (IoT) er juist steeds meer gestructureerde data geproduceerd wordt.
Analytics en big data zijn zeker geen disruptive technologieën en ze zullen ook nooit disruptive worden. Een analyse uit een database weergeeft alleen lijnen of patronen afkomstig uit de data. Onze interpretatie van deze patronen en creativiteit in het gebruik van de informatie kan wel leiden tot een disruptie. Big data en analytics blijven dus alleen hulpmiddelen om tot disruptieve ideeën te komen.
Uiteraard kan de toegang tot relevante big data leiden tot waardevolle inzichten om de eigen bedrijfsvoering te verbeteren, maar een bedrijf moet wel klaar voor zijn om de interne organisatie aan te passen zodat het gebruik van big data mogelijk wordt. Big data mag geen bijproduct zijn, maar moet altijd als hoofdproduct beschouwd worden. Zo is er een groot verschil in omzet tussen bedrijven waarin de organisatie om big data draait en de traditionele organisaties. Overigens, wat deze big data organisaties als Facebook, Google, Twitter en LinkedIn gemeen hebben is dat de CEO een IT-gerichte achtergrond heeft…
14 en 15 mei 2025 Organisaties hebben behoefte aan data science, selfservice BI, embedded BI, edge analytics en klantgedreven BI. Vaak is het dan ook tijd voor een nieuwe, toekomstbestendige data-architectuur. Dit tweedaagse seminar geeft antwoord op...
19 t/m 21 mei 2025Praktische driedaagse workshop met internationaal gerenommeerde trainer Lawrence Corr over het modelleren Datawarehouse / BI systemen op basis van dimensioneel modelleren. De workshop wordt ondersteund met vele oefeningen en praktij...
20 en 21 mei 2025 Deze 2-daagse cursus is ontworpen om dataprofessionals te voorzien van de kennis en praktische vaardigheden die nodig zijn om Knowledge Graphs en Large Language Models (LLM's) te integreren in hun workflows voor datamodelleri...
22 mei 2025 Workshop met BPM-specialist Christian Gijsels over AI-Gedreven Business Analyse met ChatGPT. Kunstmatige Intelligentie, ongetwijfeld een van de meest baanbrekende technologieën tot nu toe, opent nieuwe deuren voor analisten met innovatie...
17 t/m 19 november 2025 De DAMA DMBoK2 beschrijft 11 disciplines van Data Management, waarbij Data Governance centraal staat. De Certified Data Management Professional (CDMP) certificatie biedt een traject voor het inleidende niveau (Associate) tot...
Alleen als In-house beschikbaar Het Logical Data Warehouse, een door Gartner geïntroduceerde architectuur, is gebaseerd op een ontkoppeling van rapportage en analyse enerzijds en gegevensbronnen anderzijds. Een flexibelere architectuur waarbij snell...
Deel dit bericht