Een van de zaken waar CIO´s echt om wakker liggen is Big Data. En dan niet om de technische complexiteit, want die is relatief overzichtelijk. Maar de onbeheersbaarheid van automated discovery heeft wel onverwachte en soms ongewenste neveneffecten. Gartner heeft Information Management-specialist Frank Buytendijk gevraagd om zich volledig op dit vraagstuk te gaan richten.
Frank Buytendijk heeft een lange track record in de ICT, op het gebied van Business Intelligence, Business Process Management als technische onderwerpen, maar ook op het gebied van prestatiemanagement en strategie. Hij heeft op dat gebied veel gepubliceerd en veel projecten gedaan. Tussen 2000 en 2006 heeft hij al bij Gartner gewerkt. In die tijd kwam het verschijnsel software-consolidatie op gang.
"Daar wilde ik 'aan de andere kant' aan bijdragen", aldus Buytendijk. Zo kwam hij als VP Strategy terecht bij Hyperion, dat veel kennis had op het gebied van Business Intelligence. Die strategische waarde werd herkend door Oracle, dat Hyperion al snel overnam. "Dat was een geweldige ervaring, ik heb ruim drie jaar met veel plezier bij Oracle gewerkt en daar erg veel verschillende dingen kunnen doen."
Na consolidatie was de volgende trend dat informatie en processen steeds meer bij elkaar kwamen. "Dat waren altijd twee verschillend werelden, waar de mensen elkaar niet zagen. Die zijn dertig jaar gescheiden geweeest, maar dat was niet meer vol te houden. Ik kom uit de informatiewereld, het Nederlandse Be Informed zit aan de kant van processen, en daar ben ik CMO geworden om te helpen bij de groei.
De contacten met Gartner zijn echter altijd blijven bestaan, wat goed uitkwam met de nieuwe ontwikkelingen in ICT. Big Data komt als ene golf over de wereld heen, bedrijven herkennen informatie steeds meer als een productiefactor. Dat werd al wel twintig jaar gezegd, maar nu gebeurt het echt. Dat moet nu daadwerkelijk vorm krijgen, wat ik bij Gartner ga doen. Ik zie deze stap dan ook niet als een terugkeer naar Gartner, maar een stap verder bij Gartner."
Terug in de tijd
Big Data levert veel vragen op die Gartner krijgt van CIO's. "Daar willen we ze mee verder helpen. Er zullen in de loop der tijd best practices ontstaan die we willen delen. Daarnaast kijken we naar het software- en technologielandschap. Enigszins gechargeerd gezegd zijn we met de huidige Big Data-problematiek twintig jaar teruggezet in de tijd, het barst weer van de fragmentatie. Het databaselandschap is jarenlang stabiel geweest, met dezelfde leveranciers. Nu zijn er weer heel veel verschillende databases en tools waar organisaties mee te maken hebben. Die hebben allemaal hun doel en beperkingen. Door de enorme innovatiegolf die plaatsvindt zijn allerlei nieuwe oplossingen ontstaan. Hoe ga je daar mee om? Het leuke van het werk als Gartner analist is dat je op dat gebied het hele spectrum bestrijkt, van producten tot strategie."
Big Data is gedefinieerd door Gartner. In die definitie zijn de bekende drie V’s opgenomen: velocity, variety en volume. "Als je op een of meer van die gebieden met de bestaande middelen niet meer uitkomt heb je een Big Data-probleem. En Big Data-kansen. In praktijk wordt het vaak als bedreiging gezien. Het is overigens iets tijdelijks, er wordt nu veel in geïnvesteerd maar dat zal weer afvlakken naarmate er meer georganiseerd wordt. Het is dus een actueel thema, als onderdeel van de vier Nexus of Forces, dat je in de vingers moet krijgen. CIO’s moeten er iets mee. Dat komt onontkoombaar vanuit de buitenwereld op organisaties af. Tegelijk is het een manier om je concurrentiepositie te verbeteren."
Het probleem voor CIO´s daarbij is niet de techniek. "De oplossingen voor Big Data zijn relatief eenvoudig neer te zetten, daar kun je allerlei technologie voor gebruiken. De echte problemen zitten in het privacy-aspect. Ik merk zelfs bij congressen dat er veel emotie zit in dat onderwerp. En dat is een terechte zorg."
Onverwachte verbanden
"Het is namelijk moeilijk om Big Data in de hand te houden. Traditioneel is informatiemanagement heel overzichtelijk, dat kun je top down beheersen. Maar data die in hoge snelheid, met een hoog volume, in grote hoeveelheden wordt verwerkt, dan kun je dat niet meer overzien. Je gaat van top down naar bottom up. Daar zijn prima technieken voor, op het gebied van automated discovery. De systemen gaan proactief op zoek naar verbanden. Hoe mooi dat ook klinkt, het levert ook een groot probleem op. Technologie beantwoordt daarmee vragen beantwoord die nooit zijn gesteld.”
"Een computer heeft namelijk geen moreel besef, en kan met verbanden komen waarvan je helemaal niet wilt dat die naar buiten komen. Hier is TomTom bijvoorbeeld al eens tegenaan gelopen toen de gegevens van klanten niet alleen bij filemetingen werden gebruikt, maar ook door de politie werden aangekocht om de gemiddelde hoge snelheden op te meten. Dat is niet per se in het belang van de TomTom gebruiker."
"Je kunt genante verbanden uit data halen, bijvoorbeeld bij real-time analyse van aankopen in een supermarkt. In de VS is een vader er zo al eens achter gekomen dat zijn zestienjarige dochter zwanger was, omdat hij aanbiedingen kreeg voor zwangerschapsartikelen. Dat zijn twee voorbeelden die aangeven waar je als organisatie over moet nadenken bij Big Data. Hoe houd je dat in de hand? Dat is een zorg, want je moet het automatiseren, maar je kunt dan wel de controle kwijtraken. Ik merk dat veel mensen daarmee worstelen."
De oplossing is volgens hem niet om dan maar geen Big Data te doen. "Die keuze is er niet. Wat wèl moet gebeuren is dat de regels verwerkt worden in de systemen. Op die manier kun je voorkomen dat ongewenste gegevens naar buiten komen. Systemen moeten slimmer gemaakt worden in het contextualiseren van verbanden: wat is wel en wat is niet gewenst? Daar is discussie over, want wat de een wil, wil de ander niet. Er is op dat gebied geen waarheid. We gaan de komende tijd nog wel wat problemen meemaken op Big Data-gebied. We komen tot privacy by disaster, dat durf ik wel te voorspellen."
Praktisch advies
Buytendijk pleit voor een moreel en ethisch debat binnen bedrijven, en over bedrijfstakken heen, waarin wordt gesproken over de vraag wat goed en wat niet goed is. "Daar is niet één antwoord op, maar die discussie moet wel gevoerd worden, je moet er over nadenken. Het is zaak dat de CIO daarin het voortouw neemt. Dat zit besloten in de naam Chief Information Officer. In die discussie gaat het niet in de eerste plaats om wat er fout kan gaan, maar om de intentie. Dáár moet volgens mij het debat over gaan. Uiteindelijk gaat het om één ding: je moet goed doen. Ik heb er al erg veel over gepresenteerd de afgelopen jaren, en je merkt dat dit mensen raakt. Het roept emotie bij hen op. Soms zijn ze het ermee eens, soms niet, maar er is niemand die de discussie onbelangrijk vindt.
"Om problemen te voorkomen betekent dit in de eerste plaats meer investeren in metadata, om te weten te komen wat die informatie betekent. Begin met Masterdata-management. Dat is saai, maar wel belangrijk. Als de Masterdata niet in orde zijn kun je niets combineren, de definities moeten overal hetzelfde zijn. Dat is al veel werk. Wanneer dat op orde is kun je verder."
7 november (online seminar op 1 middag)Praktische tutorial met Alec Sharp Alec Sharp illustreert de vele manieren waarop conceptmodellen (conceptuele datamodellen) procesverandering en business analyse ondersteunen. En hij behandelt wat elke data-pr...
11 t/m 13 november 2024Praktische driedaagse workshop met internationaal gerenommeerde trainer Lawrence Corr over het modelleren Datawarehouse / BI systemen op basis van dimensioneel modelleren. De workshop wordt ondersteund met vele oefeningen en pr...
18 t/m 20 november 2024Praktische workshop met internationaal gerenommeerde spreker Alec Sharp over het modelleren met Entity-Relationship vanuit business perspectief. De workshop wordt ondersteund met praktijkvoorbeelden en duidelijke, herbruikbare ...
26 en 27 november 2024 Organisaties hebben behoefte aan data science, selfservice BI, embedded BI, edge analytics en klantgedreven BI. Vaak is het dan ook tijd voor een nieuwe, toekomstbestendige data-architectuur. Dit tweedaagse seminar geeft antwoo...
De DAMA DMBoK2 beschrijft 11 disciplines van Data Management, waarbij Data Governance centraal staat. De Certified Data Management Professional (CDMP) certificatie biedt een traject voor het inleidende niveau (Associate) tot en met hogere niveaus van...
3 april 2025 (halve dag)Praktische workshop met Alec Sharp [Halve dag] Deze workshop door Alec Sharp introduceert conceptmodellering vanuit een non-technisch perspectief. Alec geeft tips en richtlijnen voor de analist, en verkent datamodellering op c...
10, 11 en 14 april 2025Praktische driedaagse workshop met internationaal gerenommeerde spreker Alec Sharp over herkennen, beschrijven en ontwerpen van business processen. De workshop wordt ondersteund met praktijkvoorbeelden en duidelijke, herbruikba...
15 april 2025 Praktische workshop Datavisualisatie - Dashboards en Data Storytelling. Hoe gaat u van data naar inzicht? En hoe gaat u om met grote hoeveelheden data, de noodzaak van storytelling en data science? Lex Pierik behandelt de stromingen in ...
Deel dit bericht