26-09-2014

Gartner ontkracht vijf big data-mythes

Deel dit bericht

Big data is een populair onderwerp. Rond het onderwerp bestaan echter allerlei mythes. Gartner ontkracht vijf van deze mythes om IT-leveranciers te helpen hun big data-strategie beter vorm te geven.

1. "Op het gebied van big data loopt iedereen op ons voor"
Veel bedrijven hebben het gevoel op het gebied van big data achter te lopen op concurrenten. Cijfers van Gartner wijzen echter uit dat dit zeker niet het geval hoeft te zijn. 73% van de organisaties die Gartner dit jaar ondervroeg geven aan in big data te hebben geïnvesteerd of dit van plan te zijn. De meeste bedrijven bevinden zich hierbij echter nog in de beginfase. Slechts 13% van de ondervraagde ondernemingen blijkt daadwerkelijk al een big data-oplossing te hebben geïmplementeerd. Bedrijven lopen hierbij vooral tegen de uitdaging aan toevoegde waarde te realiseren uit big data. Ook het kiezen van een beginpunt om met big data aan de slag te gaan wordt door veel bedrijven als uitdaging genoemd.

2. "We hebben zoveel data dat we ons geen zorgen hoeven te maken om iedere kleine fout in data"
Veel IT-managers denken dat de enorme hoeveelheid data die zij beheren de kwaliteit van individuele data onbelangrijk maakt. Deze groep is van mening dat kwalitatief slechte individuele data geen impact heeft op de uitkomst van een data-analyse, aangezien slechts een klein percentage van de data fouten bevat.

Gartner waarschuwt dat in realiteit iedere individuele fout een impact heeft op de kwaliteit van data. Deze impact is per fout klein, maar door de grotere hoeveelheid beschikbare data zijn er ook meer fouten aanwezig in data. De totale impact van kwalitatief slechte data op de gehele dataset blijft dan ook gelijk aan de situatie voor de introductie van big data. De grotere hoeveelheid fouten kan onder andere worden toegewezen aan de herkomst van data. Veel bedrijven maken gebruik van data die door externe partijen worden aangeleverd of waarvan de herkomst onbekend is. De kwaliteit van data is hierdoor twijfelachtiger dan voorheen. Datakwaliteit is volgens Gartner in de big data-wereld dan ook juist van groot belang.

3. "Big data-technologie maakt data-integratie overbodig"
'Schema-on-read' is een model waarbij data in een systeem wordt geladen en iedere gebruikers zijn eigen schema opstelt om deze data te kunnen interpreteren. Dit is de tegenhanger van 'schema-on-write', waarbij gebruikers een schema moeten creëren voor zij data in een systeem laden. Data kan hierdoor slechts op één manier worden geïnterpreteerd, wat voor minder flexibiliteit zorgt.

Over het algemeen wordt volgens Gartner aangenomen dat big data-technologie via 'schema-on-read' organisaties in staat stelt data uit één bron in meerdere datamodellen te gebruiken. Veel mensen denken dat deze flexibiliteit eindgebruikers in staat stelt vast te stellen hoe zij bepaalde data moeten interpreteren. Ook denken veel professionals dat dit individuele gebruikers op maat toegang geeft tot data.

Gartner waarschuwt dat veel gebruikers echter afhankelijk zijn van 'schema-on-write' scenario's. In deze scenario's wordt data beschreven, content voor een bepaald gebruik voorgeschreven en is overeenstemming bereikt over de integratiteit van data en de manier waarop deze data zich tot de scenario's verhoudt.

4. "Het heeft geen zin een data warehouse te gebruiken voor geavanceerde analytics"
Veel Information Management (IM) managers zien het bouwen van een data warehouse als zinloos, aangezien geavanceerde analytics ook gebruik maakt van data die buiten het data warehouse is opgeslagen. Dit is volgens Gartner een misvatting.

Het onderzoeksbureau stelt dat veel geavanceerde analytische projecten tijdens de analyse gebruik maken van een data warehouse. In andere gevallen moeten IM-managers nieuwe data types die onderdeel zijn van big data verfijnen om deze geschikt te maken voor analyse. In dit geval moeten zij bepalen welke data relevant is, hoe deze data kan worden samengevoegd en van welke kwaliteit de data moet zijn. Deze verfijning kan ook in andere locaties dan een data warehouse worden uitgevoerd.

5. "Datameren gaan het data warehouse vervangen"
Leveranciers adverteren datameren als organisatiebrede data management platformen voor het analyseren van afzonderlijk databronnen in hun oorspronkelijke formaat.

Gartner stelt dat het misleidend is als leveranciers datameren als vervanger voor data warehouses neerzetten of als kritiek onderdeel van de analytische infrastructuur van een klant. De technologie waarop datameren zijn gebaseerd zijn volgens Gartner nog onvoldoende volwassen en beschikken nog niet over de brede reeks features die beschikbaar zijn in technologie voor data warehouses. "Data warehouses beschikken al over de mogelijkheid om een bredere reeks gebruikers in een organisatie te ondersteunen. IM-managers hoeven niet te wachten tot datameren deze achterstand inlopen", zegt Nick Heudecker, onderzoeksdirecteur bij Gartner.

Tags:

Big Data

Partners