07-10-2015 Door: Rick van der Lans

De zes Mythes over Big Data

Deel dit bericht

Tijdens de Big Data Expo, die plaats vond op 30 september en 1 oktober, was Rick van der Lans voorzitter van keynote zaal A en hield beide dagen een presentatie. Op donderdag 1 oktober weerlegde hij zes mythes omtrent big data.

Mythe 1: Big Data is een doel

Big data is geen doel. Niemand gaat zomaar een database bouwen om data te structuren alleen om het bouwen ervan. De database wordt gebouwd voor een ander doel, namelijk het analyseren van de data in de database. Big data geeft een antwoord. Specifieker gezegd, big data geeft een antwoord op vragen voortkomend uit analytics. Men begint dus altijd met analytics.

Mythe 2: Analytics = big data

Voor analytics heb je niet altijd big data nodig. Voor sommige vraagstukken heb je genoeg aan weinig data. Kwaliteit moet altijd de belangrijkste reden zijn voor de keuze aan het type en de hoeveelheid data die gebruikt wordt.

Mythe 3: Big data is te groot voor SQL

Dit is niet altijd waar, er zijn namelijk ook SQL databases die Petabytes aan data kunnen verwerken. Daarnaast is er geen duidelijke grens vanaf wanneer iets big data genoemd wordt. Wat tegenwoordig steeds vaker voorkomst is het fenomeen polyglot persistentie. In dit geval slaat een gebruiker data in verschillende databaseproducten op, gesorteerd op de soort analytics die ze erop willen toepassen. Verschillende databronnen worden in verschillende databasesystemen opgeslagen die het beste bij deze data past, bijvoorbeeld SQL of geen SQL. Daarnaast kan de combinatie ook makkelijk aangepast worden aan de wensen van de  en een combinatie die het best bij de wensen van de gebruiker past, bijvoorbeeld zo goedkoop of zo flexibel mogelijk.

Mythe 4: 80% van de data is ongestructureerd

Deze mythe is nooit onderbouwd door onderzoek, en mensen die het noemen gebruiken geen referentie of verwijzen naar een ander artikel wat ook geen bron heeft voor deze uitspraak. We weten dus helemaal niet of dit waar is, maar wat we wel weten is dat door de groei van Internet of Things (IoT) er juist steeds meer gestructureerde data geproduceerd wordt.

Mythe 5: Analytics en big data zijn “disruptive” technologieën

Analytics en big data zijn zeker geen disruptive technologieën en ze zullen ook nooit disruptive worden. Een analyse uit een database weergeeft alleen lijnen of patronen afkomstig uit de data. Onze interpretatie van deze patronen en creativiteit in het gebruik van de informatie kan wel leiden tot een disruptie. Big data en analytics blijven dus alleen hulpmiddelen om tot disruptieve ideeën te komen.

Mythe 6: Big data is voor iedereen

Uiteraard kan de toegang tot relevante big data leiden tot waardevolle inzichten om de eigen bedrijfsvoering te verbeteren, maar een bedrijf moet wel klaar voor zijn om de interne organisatie aan te passen zodat het gebruik van big data mogelijk wordt. Big data mag geen bijproduct zijn, maar moet altijd als hoofdproduct beschouwd worden. Zo is er een groot verschil in omzet tussen bedrijven waarin de organisatie om big data draait en de traditionele organisaties. Overigens, wat deze big data organisaties als Facebook, Google, Twitter en LinkedIn gemeen hebben is dat de CEO een IT-gerichte achtergrond heeft…

Company:

Big Data Expo

Rick van der Lans

Rick van der Lans is een gerespecteerd en onafhankelijk analist, adviseur, auteur en internationaal bekende spreker. Hij is gespecialiseerd in datawarehousing, business intelligence, big data en databasetechnologie. Hij heeft vele seminars en webinars gepresenteerd en keynotes bij industry-leading conferenties. Hij weet als geen ander een goede balans te vinden tussen op de praktijk toegesneden technologische en strategische zaken. Al meer dan tien jaar is hij de voorzitter van de jaarlijkse European Enterprise Data and Business Intelligence Conference in Londen en de jaarlijkse Data Warehousing en Business Intelligence Summit in Nederland. Rick helpt cliënten wereldwijd met het ontwerpen van hun data warehouse, big data en business intelligence architecturen en begeleid hen bij het selecteren van de geschikte producten. Hij is invloedrijk geweest bij het wereldwijd introduceren van de nieuwe logische datawarehouse architectuur waarmee organisaties meer flexibele business intelligence systemen kunnen ontwikkelen. Rick heeft honderden artikelen en blogs geschreven voor toonaangevende vakbladen en websites en van zijn hand zijn vele educatieve en populaire whitepapers verschenen voor een groot aantal leveranciers. Hij was de auteur van het eerste beschikbare boek over SQL, getiteld Introduction to SQL, dat in vele talen gepubliceerd is en waarvan meer dan 100.000 exemplaren verkocht zijn. Recentelijk publiceerde hij het boek Data Virtualization for Business Intelligence Systems.

Rick verzorgt bij Adept Events een seminar over Big Data Technologie, een seminar over de architectuur, ontwerp en technologie van het Logisch Datawarehouse alsmede een cursus over BI en DWH Fundamentals.

Alle blogs van deze auteur

Partners