Menig bedrijf worstelt er nog mee als ware het een tegenstander, terwijl het eigenlijk een enorme bondgenoot zou kunnen zijn. Dat was althans de kern van de boodschap van Xerox op een onlangs door het Xerox Research Center Europe belegde dag rond het fenomeen Big Data, een onderwerp dat steeds vaker helemaal bovenaan het prioriteitenlijstje van de CIO komt te staan.
De Big Data-bijeenkomst die plaatsvond in Grenoble was opgebouwd rond een door Forrester Consulting in opdracht van Xerox uitgevoerd onderzoek naar Big Data in West-Europa. Daarvoor bevroeg Forrester 330 topmanagers uit vijf West-Europese landen, te weten: Duitsland, Frankrijk, UK, België en Nederland. Maar liefst 74 procent van de ondervraagden verwacht dat zijn of haar bedrijf het komend jaar op een of andere manier al de vruchten zal plukken van investeringen in Big Data. Tegelijkertijd blijkt uit het onderzoek dat er nog heel veel uitdagingen liggen, met name op gebied van datakwaliteit en specifieke Big Data-expertise.
Wat maakt ‘Big Data Analytics’ eigenlijk zo apart? “Voor de analyse van Big Data is altijd iets extra’s nodig”, zegt Graig Saunders, director Analytics Resource Center, Xerox Consulting & Analytics. “Velen claimen dat ze te doen hebben met Big Data, terwijl dat in werkelijkheid helemaal niet zo is. Die werken wel met grote datasets, en misschien dat ze Hadoop nodig hebben voor de verwerking, maar de manier waarop ze de data analyseren, is niet wezenlijk anders dan ze gewend zijn. Ze kijken naar de data, laten hun algoritmes erop los, koppelen de resultaten terug naar het businessprobleem, gaan een paar stappen terug, passen weer wat aan en zo vorderen ze”, beschrijft Saunders. “Als je met Big Data vandoen hebt, dan is een belangrijk kenmerkend aspect dat je geen enkele manipulatie op de data los laat in de keten zelf. Je perst de data als het ware in een keer door de technologie en kijkt wat eruit komt. Als je iets wilt aanpassen, ga je helemaal terug naar het begin en start je het proces opnieuw. Want als je ergens halverwege iets verandert, dan stort het hele systeem in elkaar. Dus wat mij betreft heb je te doen met Big Data indien je technologisch of procesmatig iets speciaals moet doen, omdat de data dat afdwingen op basis van de gevarieerdheid, de snelheid of de omvang van de data.”
Grootste uitdagingen
De uitdagingen die uit het Xerox Big Data-onderzoek naar voren komen zijn gevarieerd en talrijk. De grafiek waarin ze zijn terug te vinden, telt er niet minder dan negentien. Aan de top van het lijstje vinden we de onderwerpen die zowel nu als over 12 tot 24 maanden de nodige aandacht verdienen. Het gaat om data-security en -privacy, slechte datakwaliteit, gebrek aan eigen interne vaardigheden, te weinig goede gebruikerstrainingen en geen of gebrekkige toegang tot klantgegevens of data van derden.
Tot de zaken die met name de komende 12 tot 24 maanden als uitdaging worden gezien behoren: de groei in volume en gevarieerdheid van de data, gebrek aan specialistische kennis op gebied van data-engineering, het kunnen voldoen aan wet- en regelgeving en gebrek aan vaardigheden voor het opstellen van een solide ROI-case.
De gevarieerdheid van het landschap aan Big Data-uitdagingen moet volgens Saunders niet worden geïnterpreteerd als een gebrek aan focus bij de betreffende bedrijven in West-Europa. Het is volgens hem veel meer een indicatie van de complexiteit van het Big Data-vraagstuk en geeft aan dat in de zich steeds sneller ontwikkelende wereld van tegenwoordig geen enkele uitdaging echt definitief kan worden geëlimineerd. “Er is geen enkel Big Data-probleem dat je voor eens en altijd kunt oplossen. Je kunt een bepaalde graad van controle bereiken en vervolgens regelmatig evaluaties uitvoeren. Maar je bent er nooit helemaal klaar mee. De wereld verandert daarvoor te snel. Net als de wet en regelgeving. Ook die is constant in beweging.”
Om succes te hebben met Big Data zullen bedrijven allereerst de diverse datasilo’s te lijf moeten die ze vrijwel allemaal nog hebben staan. “Klanten vragen om een zogeheten ‘single view of services’, compleet met de gepersonaliseerde interactiemechanismes en informatiestromen die daar bij horen. Om daaraan te kunnen voldoen, moeten bedrijven echter kunnen beschikken over een ‘single view of the customer’. En om dat voor elkaar te krijgen, zal bij menig bedrijf de nodige verouderde technologie moeten worden opgeruimd.”
Statistiek en Big Data
Wat is de rol van statistiek in de analyse van Big Data? Wordt die misschien minder belangrijk, gezien de enorme datasets die je tot je beschikking hebt? Saunders is van mening dat die alleen maar belangrijker wordt. “Even simpel gesteld is het waar”, zegt hij, “dat als je een iets minder goed algoritme hebt, waar je een hoop data tegenaan kunt gooien, je toch nog tot een resultaat kunt komen. En omgekeerd, dat als je over minder data beschikt, je meer algoritmische trucjes nodig hebt om hetzelfde resultaat te behalen. Maar dat neemt niet weg dat je ook voor de analyse van Big Data de allerbeste statistiek moet inzetten. Want Big Data kunnen heel misleidend zijn. Voordat ik bij Xerox kwam, heb ik een tijdje als consultant gewerkt en een groot deel van de problemen die ik tegenkwam, was terug te voeren op mensen die gebruikmaakten van de krachtige technieken die voorhanden waren, maar de statistiek niet begrepen die eraan ten grondslag lag. Met slechte businessbeslissingen tot gevolg.”
Succesvoorbeeld
Wat je met een adequate inzet van analysetechnieken met behulp van Big Data kunt bereiken, heeft Xerox Services onder meer aangetoond in Los Angeles waar het met een ingenieus systeem van met sensoren uitgeruste parkeerplekken, gecombineerd met slimme real-time analyse van parkeervraag- en aanbodgegevens een enorme efficiëntieslag heeft weten te bewerkstelligen. Niet alleen kunnen parkeerders nu dynamisch naar vrije parkeerplekken worden gedirigeerd, waardoor onnodig rondrijden wordt voorkomen. Dat op zich is natuurlijk al een enorme vooruitgang op bijvoorbeeld milieugebied. Maar de Big Data-analyse leverde tevens een krachtig instrument voor de beïnvloeding van het parkeergedrag door middel van subtiele aanpassingen in de parkeertarieven. Het betreffende systeem kon in het XRCE in Grenoble live worden gedemonstreerd. Zeer indrukwekkend!
Door: Dick Schievels
8 en 9 januari 2025 Organisaties hebben behoefte aan data science, selfservice BI, embedded BI, edge analytics en klantgedreven BI. Vaak is het dan ook tijd voor een nieuwe, toekomstbestendige data-architectuur. Dit tweedaagse seminar geeft antwoord ...
2 april 2025 Schrijf in voor al weer de twaalfde editie van ons jaarlijkse congres met wederom een ijzersterke sprekers line-up. Op deze editie behandelen wij belangrijke thema’s als Moderne Cloud Data Architecturen, Datawarehouse Design met Ge...
3 april 2025 (halve dag)Praktische workshop met Alec Sharp [Halve dag] Deze workshop door Alec Sharp introduceert conceptmodellering vanuit een non-technisch perspectief. Alec geeft tips en richtlijnen voor de analist, en verkent datamodellering op c...
3 april 2025 Deze workshop met Winfried Etzel behandelt de centrale pijler van Data Mesh: Federated Data Governance. Hoe zorg je voor een goede balans tussen autonomie en centrale regie? Praktische workshop van een halve dag op 3 april in Utre...
3 april 2025 In de snel veranderende wereld van vandaag is het effectief benutten en beheren van gegevens een kritieke succesfactor voor organisaties. Deze cursus biedt een fundamenteel begrip van Master Data Management (MDM) en de centrale ro...
7 t/m 9 april 2025Praktische workshop met internationaal gerenommeerde spreker Alec Sharp over het modelleren met Entity-Relationship vanuit business perspectief. De workshop wordt ondersteund met praktijkvoorbeelden en duidelijke, herbruikbare richt...
10, 11 en 14 april 2025Praktische driedaagse workshop met internationaal gerenommeerde spreker Alec Sharp over herkennen, beschrijven en ontwerpen van business processen. De workshop wordt ondersteund met praktijkvoorbeelden en duidelijke, herbruikba...
15 april 2025 Praktische workshop Datavisualisatie - Dashboards en Data Storytelling. Hoe gaat u van data naar inzicht? En hoe gaat u om met grote hoeveelheden data, de noodzaak van storytelling en data science? Lex Pierik behandelt de stromingen in ...
Deel dit bericht