07-10-2015 Door: Rick van der Lans

De zes Mythes over Big Data

Deel dit bericht

Tijdens de Big Data Expo, die plaats vond op 30 september en 1 oktober, was Rick van der Lans voorzitter van keynote zaal A en hield beide dagen een presentatie. Op donderdag 1 oktober weerlegde hij zes mythes omtrent big data.

Mythe 1: Big Data is een doel

Big data is geen doel. Niemand gaat zomaar een database bouwen om data te structuren alleen om het bouwen ervan. De database wordt gebouwd voor een ander doel, namelijk het analyseren van de data in de database. Big data geeft een antwoord. Specifieker gezegd, big data geeft een antwoord op vragen voortkomend uit analytics. Men begint dus altijd met analytics.

Mythe 2: Analytics = big data

Voor analytics heb je niet altijd big data nodig. Voor sommige vraagstukken heb je genoeg aan weinig data. Kwaliteit moet altijd de belangrijkste reden zijn voor de keuze aan het type en de hoeveelheid data die gebruikt wordt.

Mythe 3: Big data is te groot voor SQL

Dit is niet altijd waar, er zijn namelijk ook SQL databases die Petabytes aan data kunnen verwerken. Daarnaast is er geen duidelijke grens vanaf wanneer iets big data genoemd wordt. Wat tegenwoordig steeds vaker voorkomst is het fenomeen polyglot persistentie. In dit geval slaat een gebruiker data in verschillende databaseproducten op, gesorteerd op de soort analytics die ze erop willen toepassen. Verschillende databronnen worden in verschillende databasesystemen opgeslagen die het beste bij deze data past, bijvoorbeeld SQL of geen SQL. Daarnaast kan de combinatie ook makkelijk aangepast worden aan de wensen van de  en een combinatie die het best bij de wensen van de gebruiker past, bijvoorbeeld zo goedkoop of zo flexibel mogelijk.

Mythe 4: 80% van de data is ongestructureerd

Deze mythe is nooit onderbouwd door onderzoek, en mensen die het noemen gebruiken geen referentie of verwijzen naar een ander artikel wat ook geen bron heeft voor deze uitspraak. We weten dus helemaal niet of dit waar is, maar wat we wel weten is dat door de groei van Internet of Things (IoT) er juist steeds meer gestructureerde data geproduceerd wordt.

Mythe 5: Analytics en big data zijn “disruptive” technologieën

Analytics en big data zijn zeker geen disruptive technologieën en ze zullen ook nooit disruptive worden. Een analyse uit een database weergeeft alleen lijnen of patronen afkomstig uit de data. Onze interpretatie van deze patronen en creativiteit in het gebruik van de informatie kan wel leiden tot een disruptie. Big data en analytics blijven dus alleen hulpmiddelen om tot disruptieve ideeën te komen.

Mythe 6: Big data is voor iedereen

Uiteraard kan de toegang tot relevante big data leiden tot waardevolle inzichten om de eigen bedrijfsvoering te verbeteren, maar een bedrijf moet wel klaar voor zijn om de interne organisatie aan te passen zodat het gebruik van big data mogelijk wordt. Big data mag geen bijproduct zijn, maar moet altijd als hoofdproduct beschouwd worden. Zo is er een groot verschil in omzet tussen bedrijven waarin de organisatie om big data draait en de traditionele organisaties. Overigens, wat deze big data organisaties als Facebook, Google, Twitter en LinkedIn gemeen hebben is dat de CEO een IT-gerichte achtergrond heeft…

Company:

Big Data Expo

Rick van der Lans

Rick van der Lans is onafhankelijk adviseur, docent en auteur op het terrein van datawarehousing, business intelligence, big data en databasetechnologie. Als consultant heeft hij door de jaren heen veel grote bedrijven geadviseerd bij het ontwerpen van hun datawarehouse- en big data architecturen. Rick heeft als spreker op conferenties een zeer goede naam verworven zowel in binnen- als buitenland en is chairman van de jaarlijkse Datawarehousing & BI Summit.  Hij weet als geen ander een goede balans te vinden tussen op de praktijk toegesneden technologische ontwikkelingen en strategische zaken. Hij schrijft voor diverse bekende websites waaronder BI-Platform. Verschillende van zijn boeken, waaronder het populaire "SQL Leerboek", zijn in vele talen gepubliceerd. Recent is van zijn hand verschenen "Data Virtualization for Business Intelligence Systems", alsook tientallen whitepapers over BI. Rick verzorgt bij Adept Events een seminar over Hadoop, NoSQL en Big Data alsmede een seminar over de architectuur, ontwerp en technologie van het Logisch Datawarehouse.

Alle blogs van deze auteur

Partners