Big data is een populair onderwerp. Rond het onderwerp bestaan echter allerlei mythes. Gartner ontkracht vijf van deze mythes om IT-leveranciers te helpen hun big data-strategie beter vorm te geven.
1. "Op het gebied van big data loopt iedereen op ons voor"
Veel bedrijven hebben het gevoel op het gebied van big data achter te lopen op concurrenten. Cijfers van Gartner wijzen echter uit dat dit zeker niet het geval hoeft te zijn. 73% van de organisaties die Gartner dit jaar ondervroeg geven aan in big data te hebben geïnvesteerd of dit van plan te zijn. De meeste bedrijven bevinden zich hierbij echter nog in de beginfase. Slechts 13% van de ondervraagde ondernemingen blijkt daadwerkelijk al een big data-oplossing te hebben geïmplementeerd. Bedrijven lopen hierbij vooral tegen de uitdaging aan toevoegde waarde te realiseren uit big data. Ook het kiezen van een beginpunt om met big data aan de slag te gaan wordt door veel bedrijven als uitdaging genoemd.
2. "We hebben zoveel data dat we ons geen zorgen hoeven te maken om iedere kleine fout in data"
Veel IT-managers denken dat de enorme hoeveelheid data die zij beheren de kwaliteit van individuele data onbelangrijk maakt. Deze groep is van mening dat kwalitatief slechte individuele data geen impact heeft op de uitkomst van een data-analyse, aangezien slechts een klein percentage van de data fouten bevat.
Gartner waarschuwt dat in realiteit iedere individuele fout een impact heeft op de kwaliteit van data. Deze impact is per fout klein, maar door de grotere hoeveelheid beschikbare data zijn er ook meer fouten aanwezig in data. De totale impact van kwalitatief slechte data op de gehele dataset blijft dan ook gelijk aan de situatie voor de introductie van big data. De grotere hoeveelheid fouten kan onder andere worden toegewezen aan de herkomst van data. Veel bedrijven maken gebruik van data die door externe partijen worden aangeleverd of waarvan de herkomst onbekend is. De kwaliteit van data is hierdoor twijfelachtiger dan voorheen. Datakwaliteit is volgens Gartner in de big data-wereld dan ook juist van groot belang.
3. "Big data-technologie maakt data-integratie overbodig"
'Schema-on-read' is een model waarbij data in een systeem wordt geladen en iedere gebruikers zijn eigen schema opstelt om deze data te kunnen interpreteren. Dit is de tegenhanger van 'schema-on-write', waarbij gebruikers een schema moeten creëren voor zij data in een systeem laden. Data kan hierdoor slechts op één manier worden geïnterpreteerd, wat voor minder flexibiliteit zorgt.
Over het algemeen wordt volgens Gartner aangenomen dat big data-technologie via 'schema-on-read' organisaties in staat stelt data uit één bron in meerdere datamodellen te gebruiken. Veel mensen denken dat deze flexibiliteit eindgebruikers in staat stelt vast te stellen hoe zij bepaalde data moeten interpreteren. Ook denken veel professionals dat dit individuele gebruikers op maat toegang geeft tot data.
Gartner waarschuwt dat veel gebruikers echter afhankelijk zijn van 'schema-on-write' scenario's. In deze scenario's wordt data beschreven, content voor een bepaald gebruik voorgeschreven en is overeenstemming bereikt over de integratiteit van data en de manier waarop deze data zich tot de scenario's verhoudt.
4. "Het heeft geen zin een data warehouse te gebruiken voor geavanceerde analytics"
Veel Information Management (IM) managers zien het bouwen van een data warehouse als zinloos, aangezien geavanceerde analytics ook gebruik maakt van data die buiten het data warehouse is opgeslagen. Dit is volgens Gartner een misvatting.
Het onderzoeksbureau stelt dat veel geavanceerde analytische projecten tijdens de analyse gebruik maken van een data warehouse. In andere gevallen moeten IM-managers nieuwe data types die onderdeel zijn van big data verfijnen om deze geschikt te maken voor analyse. In dit geval moeten zij bepalen welke data relevant is, hoe deze data kan worden samengevoegd en van welke kwaliteit de data moet zijn. Deze verfijning kan ook in andere locaties dan een data warehouse worden uitgevoerd.
5. "Datameren gaan het data warehouse vervangen"
Leveranciers adverteren datameren als organisatiebrede data management platformen voor het analyseren van afzonderlijk databronnen in hun oorspronkelijke formaat.
Gartner stelt dat het misleidend is als leveranciers datameren als vervanger voor data warehouses neerzetten of als kritiek onderdeel van de analytische infrastructuur van een klant. De technologie waarop datameren zijn gebaseerd zijn volgens Gartner nog onvoldoende volwassen en beschikken nog niet over de brede reeks features die beschikbaar zijn in technologie voor data warehouses. "Data warehouses beschikken al over de mogelijkheid om een bredere reeks gebruikers in een organisatie te ondersteunen. IM-managers hoeven niet te wachten tot datameren deze achterstand inlopen", zegt Nick Heudecker, onderzoeksdirecteur bij Gartner.
7 november (online seminar op 1 middag)Praktische tutorial met Alec Sharp Alec Sharp illustreert de vele manieren waarop conceptmodellen (conceptuele datamodellen) procesverandering en business analyse ondersteunen. En hij behandelt wat elke data-pr...
11 t/m 13 november 2024Praktische driedaagse workshop met internationaal gerenommeerde trainer Lawrence Corr over het modelleren Datawarehouse / BI systemen op basis van dimensioneel modelleren. De workshop wordt ondersteund met vele oefeningen en pr...
18 t/m 20 november 2024Praktische workshop met internationaal gerenommeerde spreker Alec Sharp over het modelleren met Entity-Relationship vanuit business perspectief. De workshop wordt ondersteund met praktijkvoorbeelden en duidelijke, herbruikbare ...
26 en 27 november 2024 Organisaties hebben behoefte aan data science, selfservice BI, embedded BI, edge analytics en klantgedreven BI. Vaak is het dan ook tijd voor een nieuwe, toekomstbestendige data-architectuur. Dit tweedaagse seminar geeft antwoo...
De DAMA DMBoK2 beschrijft 11 disciplines van Data Management, waarbij Data Governance centraal staat. De Certified Data Management Professional (CDMP) certificatie biedt een traject voor het inleidende niveau (Associate) tot en met hogere niveaus van...
3 april 2025 (halve dag)Praktische workshop met Alec Sharp [Halve dag] Deze workshop door Alec Sharp introduceert conceptmodellering vanuit een non-technisch perspectief. Alec geeft tips en richtlijnen voor de analist, en verkent datamodellering op c...
10, 11 en 14 april 2025Praktische driedaagse workshop met internationaal gerenommeerde spreker Alec Sharp over herkennen, beschrijven en ontwerpen van business processen. De workshop wordt ondersteund met praktijkvoorbeelden en duidelijke, herbruikba...
15 april 2025 Praktische workshop Datavisualisatie - Dashboards en Data Storytelling. Hoe gaat u van data naar inzicht? En hoe gaat u om met grote hoeveelheden data, de noodzaak van storytelling en data science? Lex Pierik behandelt de stromingen in ...
Deel dit bericht