Je hoort in de moderne organisatie steeds vaker het woord Big Data vallen. Hoewel niet alle bedrijven zich bezighouden met Big Data, heeft het onderwerp meer bekendheid gekregen in de business gezien de recente explosie van digitale gegevens en de snelle ontwikkeling van de technologie en sociale media. Met behulp van analytics zijn bedrijven beter naar hun Big Data gaan kijken om meer inzicht in de markt en de concurrentie te krijgen. Big Data Analytics wil informatie verzamelen van bedrijfsgegevens en die in zakelijk voordeel vertalen. Zakelijke leiders en managers willen kunnen meten en de verkregen gegevens aanwenden voor verbeterde besluitvorming en prestaties. Recente interviews met leidinggevenden bij 330 openbare Noord-Amerikaanse bedrijven, georganiseerd door MIT Center for Digital Business en McKinsey's, geeft aan dat hoe duidelijker bedrijven zichzelf karakteriseren als data-driven, hoe beter ze presteren op financiëel en operationeel vlak. Bedrijven in de top van gebruikers van data-driven besluitvorming waren gemiddeld 5% productiever en maakten 6% meer winst dan hun concurrenten.
De definitie van Big Data kan vanuit verschillende dimensies worden benaderd: volume, snelheid en variëteit. Big Data gaat over een extreem datavolume. In 2012 was er ongeveer 2,5 exabyte (een miljard gigabytes) aan gegevens aanwezig. Dit was in de periode daarvoor iedere 40 maanden verdubbeld. De rol van het internet heeft een belangrijke bijdrage geleverd aan deze extreme hoeveelheid gegevens; er zijn bedrijven die werken met vele petabytes (een biljard bytes) aan gegevens in een enkele dataset. Big Data is gerelateerd aan de snelheid van data creatie en invoer. Het gaat om het in real-time of bijna real-time informatie vast te leggen en snel te gebruiken om zakelijke activiteiten te ondersteunen. Bijvoorbeeld door het begrijpen van consumentengedrag met behulp van een slimme camera in een winkel of nadat een klant incheckt bij de kassa van een webwinkel kunnen verschillende producten of diensten als een persoonlijke promotie worden aangeboden.
Big Data bevat een grote verscheidenheid aan informatie. In het verleden waren bedrijven alleen gericht op gestructureerde databases waarin de meeste bedrijfsgegevens werden opgeslagen. Tegenwoordig moeten bedrijven omgaan met veel meer bronnen, zoals mobiele telefoons, online winkelsystemen, sociale netwerken, elektronische communicatie, GPS, etc. Vooral met de grote hoeveelheden informatie uit sociale netwerken en snelle ontwikkeling van de technologie, zijn er tal van ongestructureerde data waaruit ook de ‘ruis’ kan worden geanalyseerd. Een andere dimensie die verband houdt met de definitie van Big Data betreft de complexiteit van de data types, samenstelling, format en regels. Gegevens uit meerdere bronnen maakt het enorm moeilijk om gegevens tussen systemen te transformeren, te linken, aan te passen en op te schonen.
Big Data Analytics is een intelligente analyse van big data, die anders is dan de traditionele Business Intelligence. Het is geen geheim in een grote data en analytics discussie, dat de rol van mensen in een Big Data organisatie steeds belangrijker wordt, terwijl het proces van het vinden van de 'juiste' persoon steeds omslachtiger wordt. Als de Big Data-technologie niet volwassen genoeg is, kan de organisatie dit compenseren door meer aandacht te schenken aan mensen en processen. Bijvoorbeeld door mensen centraal te stellen bij elk data initiatief in de organisatie, en door het bouwen van sterke data governance-processen. Dit aspect van Data Management is cruciaal voor elke organisatie.
"Als de Big Data-technologie niet volwassen genoeg is, moet een organisatie deze leemte opvullen door meer te focussen op mensen en processen"
De mogelijkheid van een bedrijf om extreme gegevens te beheren is een kerncompetentie bij de snelle ontwikkeling van de sociale media en technologie. Bedrijven die in toenemende mate gebruik maken van nieuwe vormen van informatie, zoals tekst, sociale en context, kunnen hun strategie optimaliseren door te kijken naar patronen in zakelijke beslissingen, die bekend staat als Pattern Based Strategy. Dit om nieuwe en bruikbare inzichten te krijgen, door het verkrijgen van duidelijk begrip van het patroon in zowel gestructureerde als ongestructureerde data. En verder om de zakelijke voordelen van die patronen te kennen, om hun grote data-analyse doelen te schetsen, en ten slotte om mensen, proces en technologie op elkaar af te stemmen.
Een belangrijke rol in elke data-organisatie is de rol van Data Steward. Als 'caretaker' van de data, zorgt de Data Steward voor juistheid, volledigheid, integriteit en kwaliteit van de gegevens in de organisatie. De Data Steward heeft goed begrip van data op zich en het gebruik ervan in het bedrijf of organisatie. Normaal gesproken werkt de Data Steward nauw samen met de data owner om de data standaarden te definiëren en om advies in te winnen om data probleem permanent op te lossen. De Data Steward is vaak ook de ‘kwaliteitskampioen’ en actief betrokken bij data kwaliteit initiatieven.
Data Stewards in de 21e eeuw
Big Data en Analytics hebben het databeheer bij bedrijven flink op de schop gegooid. Een aantal best practices van traditioneel Data Management is niet toepasbaar en de rol van de data organisatie binnen het bedrijf wordt daardoor beïnvloed. Tenminste drie voorwaarden moeten aanwezig zijn om met Big Data Analytics te kunnen omgaan, rekening houdend met de mensenrol in de organisatie: Het promoten van Pattern-Based Strategy; meer en sneller investeren in analytics (voorspellend, samenwerkend, alomtegenwoordig) ; en de juiste experts (Data Scientists) om het beleid uit te voeren.
Een nieuwe rol is aansluiting zoeken bij de wereld van Big Data en Analytics. De organisatie investeert niet alleen in de technologie, maar is ook serieus op zoek naar mensen die het werk zelf kunnen doen, weten wat het bedrijfsleven nodig heeft en antwoorden kunnen ventileren uit de big data. Zoals Thomas H. Davenport en D.J. Patil zeggen: “Data Scientists zijn de mensen die begrijpen hoe zij de antwoorden op belangrijke zakelijke vragen kunnen vissen uit de tsunami van ongestructureerde informatie”. De Data Scientist is daarmee de belangrijkste factor in het op feiten gebaseerde en op besluitvorming georiënteerde business proces.
Het vinden van Data Scientists voor big data-analytics is een zware taak. In feite is het tekort aan Data Scientists niet alleen een grote uitdaging geworden voor de organisatie, ook het talent ontdekken, aantrekken en laten functioneren is niet eenvoudig. De vaardigheden van een Data Scientist verschillen nogal van die voor andere rollen binnen de organisatie. Bovendien is voor veel mensen niet duidelijk wat de Data Scientist kan betekenen voor de business en wat de tastbare voordelen van de functie zijn. Er zijn maar weinig definities die de rol van de Data Scientist in de organisatie beschrijven. Douglas Laney en Lisa Kart beschrijven de rol van de Data Scientist als “een deskundige op het gebied van data management, analytics modellering en business analyse”.
Gezien deze drie rollen en de uitdaging om de rol van Data Scientist goed in te vullen, moeten bedrijven overwegen hun data steward de rol van Data Scientist toe te kennen. Een data-steward in de data organisatie is handig in het uitvoeren van data-integratie, het vinden van verbanden in verschillende datasets. De data steward heeft de vaardigheid om data profiling en validatie uit te voeren en is nauw betrokken bij het opschonen van data. De data steward is vertrouwd met programmeren, wat ook belangrijk is voor de Data Scientist. Bij de uitvoering van hun werk, moeten de data stewards de zakelijke context begrijpen, waarvoor de analyse wordt uitgevoerd. Elke data steward moet ook in staat zijn om zakelijke problemen te onderkennen en zijn analytische vaardigheid kunnen inzetten om bepaalde hypotheses en alternatieven aan te dragen. De data steward is ook in staat om een heldere analyse van de bedrijfssituatie te maken en deze te communiceren met de verschillende stakeholders, waaronder de business executives.
Een data steward in de organisatie moet data management en business analyse als onderdeel van zijn dagelijkse werkzaamheden kunnen rekenen, om de rol van Data Scientist te kunnen vervullen. Vervolgens zal hij zich moeten bekwamen in analytics modellering.
Huur Big Data Team
Uit recent onderzoek door Gartner blijkt dat bedrijven om succes te boeken met big data-analytics deskundige analyse groepen met zakelijke en technologische expertise noodzakelijk zijn om tegenwicht te bieden aan de onvolwassenheid van big data technologie. Het gaat daarbij om multidisciplinaire teams die innovatief denken kunnen stimuleren, constant ideeën en creativiteit stimuleren. Gartner beveelt aan de data wetenschap te benaderen als een set van vaardigheden die het best kan worden vervuld met een team aanpak.
Het hebben van een combinatie van verschillende vaardigheden in een teambenadering is als het stimuleren van de linker-en rechterhelft van de hersenen, het hebben van een team met logische, analytische en objectieve standpunten, evenals het handhaven van creativiteit, out of the box denken, en een intuïtieve ‘mindset’.
De noodzaak van het hebben van een multidisciplinair team is in de eerste plaats om een goede mix van business en technologie te krijgen, die mix kan soms bestaan uit kunst en wetenschap. Terwijl sommige big data teamrollen zoals computer programmeurs, statistici en data-architecten meestal worden ingevuld door mensen met een introvert karakter, vereist big data analytics ook extraverte mensen om zakelijke klanten, partners en concurrenten te kunnen begrijpen. Met een grotere mix van persoonlijkheden en vaardigheden, kan het big data team profiteren van gespecialiseerde vaardigheden die niet-traditioneel zijn voor het bedrijf, zoals psychologen en taalkundigen, of zeer specifieke vaardigheden in bijzondere technologieën zoals bijvoorbeeld Hadoop. Door het hebben van een combinatie van mensen in het big data-team, zal constant worden gebrainstormd, waardoor er meer inspirerende discussies ontstaan om complexe zakelijke problemen op te lossen.
Samenvatting
Big Data is nog steeds een hot topic in de hedendaagse zakelijke concurrentie. Bedrijven hebben Big Data Analytics nodig om inzicht te krijgen in hun business en betere beslissingen te kunnen nemen. Onderzoek bevestigt dat hoe meer bedrijven zich identificeren als data-gedreven, hoe productiever en winstgevender ze worden. De mensenrol in een Big Data organisatie is van groot belang om de tekortkomingen in de Big Data-technologie te compenseren. Als beheerder van bedrijfsgegevens, vervult de Data Steward een sleutelrol in de data-organisatie. De Data Stewards hebben een goede kennis van zowel data als de zakelijke kant van de organisatie, ze hebben zowel Data Management als Business Analysis ontwikkeld. Big Data Analytics hebben ervoor gezorgd dat de Data Steward goed kan omgaan met extreme hoeveelheden gegevens met behulp van pattern-based strategie. De sterke behoefte om bepaalde patronen te ontdekken in de gestructureerde en ongestructureerde data om zakelijke beslissingen te ondersteunen leidt ertoe dat er een nieuw soort data experts ontstaan: de Data Scientists.
Omdat het inhuren van een Data Scientist die het succes van het bedrijf ‘overnight’ kan garanderen net zo moeilijk is als het vinden van een speld in een hooiberg, kan het bedrijf beter inzet en tijd investeren in de data stewards. Traditionele data stewards zijn de mensen die hun handen hebben vuilgemaakt met werken aan data en hebben vaak een goed idee over het bedrijf. Bedrijven kunnen voor de lange termijn hun data stewards helpen om hun kennis van analytics modeling te vergroten. Hiermee kan tijdelijk het tekort aan echte Data Scientists worden opgelost. Om op korte termijn de voordelen van big data voor het bedrijf te kunnen inzetten, is het inhuren van een Big Data Team een optie. Als straks de nieuwe generatie Data Scientists opstaat kunnen zij een lange termijn big data plan opstellen.
Over de schrijver:
Daniel Santosa Harsono is data management professional en consultant bij Accenture. Voorheen was hij Global Data Steward bij een wereldwijd werkende brouwerij.
7 november (online seminar op 1 middag)Praktische tutorial met Alec Sharp Alec Sharp illustreert de vele manieren waarop conceptmodellen (conceptuele datamodellen) procesverandering en business analyse ondersteunen. En hij behandelt wat elke data-pr...
11 t/m 13 november 2024Praktische driedaagse workshop met internationaal gerenommeerde trainer Lawrence Corr over het modelleren Datawarehouse / BI systemen op basis van dimensioneel modelleren. De workshop wordt ondersteund met vele oefeningen en pr...
18 t/m 20 november 2024Praktische workshop met internationaal gerenommeerde spreker Alec Sharp over het modelleren met Entity-Relationship vanuit business perspectief. De workshop wordt ondersteund met praktijkvoorbeelden en duidelijke, herbruikbare ...
26 en 27 november 2024 Organisaties hebben behoefte aan data science, selfservice BI, embedded BI, edge analytics en klantgedreven BI. Vaak is het dan ook tijd voor een nieuwe, toekomstbestendige data-architectuur. Dit tweedaagse seminar geeft antwoo...
De DAMA DMBoK2 beschrijft 11 disciplines van Data Management, waarbij Data Governance centraal staat. De Certified Data Management Professional (CDMP) certificatie biedt een traject voor het inleidende niveau (Associate) tot en met hogere niveaus van...
3 april 2025 (halve dag)Praktische workshop met Alec Sharp [Halve dag] Deze workshop door Alec Sharp introduceert conceptmodellering vanuit een non-technisch perspectief. Alec geeft tips en richtlijnen voor de analist, en verkent datamodellering op c...
10, 11 en 14 april 2025Praktische driedaagse workshop met internationaal gerenommeerde spreker Alec Sharp over herkennen, beschrijven en ontwerpen van business processen. De workshop wordt ondersteund met praktijkvoorbeelden en duidelijke, herbruikba...
15 april 2025 Praktische workshop Datavisualisatie - Dashboards en Data Storytelling. Hoe gaat u van data naar inzicht? En hoe gaat u om met grote hoeveelheden data, de noodzaak van storytelling en data science? Lex Pierik behandelt de stromingen in ...
Deel dit bericht