02-02-2013

Frank Buytendijk, Gartner: 'Privacy is belangrijkste zorg bij Big Data'

Deel dit bericht


Een van de zaken waar CIO´s echt om wakker liggen is Big Data. En dan niet om de technische complexiteit, want die is relatief overzichtelijk. Maar de onbeheersbaarheid van automated discovery heeft wel onverwachte en soms ongewenste neveneffecten. Gartner heeft Information Management-specialist Frank Buytendijk gevraagd om zich volledig op dit vraagstuk te gaan richten.

Frank Buytendijk heeft een lange track record in de ICT, op het gebied van Business Intelligence, Business Process Management als technische onderwerpen, maar ook op het gebied van prestatiemanagement en strategie. Hij heeft op dat gebied veel gepubliceerd en veel projecten gedaan. Tussen 2000 en 2006 heeft hij al bij Gartner gewerkt. In die tijd kwam het verschijnsel software-consolidatie op gang.

"Daar wilde ik 'aan de andere kant' aan bijdragen", aldus Buytendijk. Zo kwam hij als VP Strategy terecht bij Hyperion, dat veel kennis had op het gebied van Business Intelligence. Die strategische waarde werd herkend door Oracle, dat Hyperion al snel overnam. "Dat was een geweldige ervaring, ik heb ruim drie jaar met veel plezier bij Oracle gewerkt en daar erg veel verschillende dingen kunnen doen."

Na consolidatie was de volgende trend dat informatie en processen steeds meer bij elkaar kwamen. "Dat waren altijd twee verschillend werelden, waar de mensen elkaar niet zagen. Die zijn dertig jaar gescheiden geweeest, maar dat was niet meer vol te houden. Ik kom uit de informatiewereld, het Nederlandse Be Informed zit aan de kant van processen, en daar ben ik CMO geworden om te helpen bij de groei.

De contacten met Gartner zijn echter altijd blijven bestaan, wat goed uitkwam met de nieuwe ontwikkelingen in ICT. Big Data komt als ene golf over de wereld heen, bedrijven herkennen informatie steeds meer als een productiefactor. Dat werd al wel twintig jaar gezegd, maar nu gebeurt het echt. Dat moet nu daadwerkelijk vorm krijgen, wat ik bij Gartner ga doen. Ik zie deze stap dan ook niet als een terugkeer naar Gartner, maar een stap verder bij Gartner."

Terug in de tijd

Big Data levert veel vragen op die Gartner krijgt van CIO's. "Daar willen we ze mee verder helpen. Er zullen in de loop der tijd best practices ontstaan die we willen delen. Daarnaast kijken we naar het software- en technologielandschap. Enigszins gechargeerd gezegd zijn we met de huidige Big Data-problematiek twintig jaar teruggezet in de tijd, het barst weer van de fragmentatie. Het databaselandschap is jarenlang stabiel geweest, met dezelfde leveranciers. Nu zijn er weer heel veel verschillende databases en tools waar organisaties mee te maken hebben. Die hebben allemaal hun doel en beperkingen. Door de enorme innovatiegolf die plaatsvindt zijn allerlei nieuwe oplossingen ontstaan. Hoe ga je daar mee om? Het leuke van het werk als Gartner analist is dat je op dat gebied het hele spectrum bestrijkt, van producten tot strategie."

Big Data is gedefinieerd door Gartner. In die definitie zijn de bekende drie V’s opgenomen: velocity, variety en volume. "Als je op een of meer van die gebieden met de bestaande middelen niet meer uitkomt heb je een Big Data-probleem. En Big Data-kansen. In praktijk wordt het vaak als bedreiging gezien. Het is overigens iets tijdelijks, er wordt nu veel in geïnvesteerd maar dat zal weer afvlakken naarmate er meer georganiseerd wordt. Het is dus een actueel thema, als onderdeel van de vier Nexus of Forces, dat je in de vingers moet krijgen. CIO’s moeten er iets mee. Dat komt onontkoombaar vanuit de buitenwereld op organisaties af. Tegelijk is het een manier om je concurrentiepositie te verbeteren."

Het probleem voor CIO´s daarbij is niet de techniek. "De oplossingen voor Big Data zijn relatief eenvoudig neer te zetten, daar kun je allerlei technologie voor gebruiken. De echte problemen zitten in het privacy-aspect. Ik merk zelfs bij congressen dat er veel emotie zit in dat onderwerp. En dat is een terechte zorg."

Onverwachte verbanden

"Het is namelijk moeilijk om Big Data in de hand te houden. Traditioneel is informatiemanagement heel overzichtelijk, dat kun je top down beheersen. Maar data die in hoge snelheid, met een hoog volume, in grote hoeveelheden wordt verwerkt, dan kun je dat niet meer overzien. Je gaat van top down naar bottom up. Daar zijn prima technieken voor, op het gebied van automated discovery. De systemen gaan proactief op zoek naar verbanden. Hoe mooi dat ook klinkt, het levert ook een groot probleem op. Technologie beantwoordt daarmee vragen beantwoord die nooit zijn gesteld.”

"Een computer heeft namelijk geen moreel besef, en kan met verbanden komen waarvan je helemaal niet wilt dat die naar buiten komen. Hier is TomTom bijvoorbeeld al eens tegenaan gelopen toen de gegevens van klanten niet alleen bij filemetingen werden gebruikt, maar ook door de politie werden aangekocht om de gemiddelde hoge snelheden op te meten. Dat is niet per se in het belang van de TomTom gebruiker."

"Je kunt genante verbanden uit data halen, bijvoorbeeld bij real-time analyse van aankopen in een supermarkt. In de VS is een vader er zo al eens achter gekomen dat zijn zestienjarige dochter zwanger was, omdat hij aanbiedingen kreeg voor zwangerschapsartikelen. Dat zijn twee voorbeelden die aangeven waar je als organisatie over moet nadenken bij Big Data. Hoe houd je dat in de hand? Dat is een zorg, want je moet het automatiseren, maar je kunt dan wel de controle kwijtraken. Ik merk dat veel mensen daarmee worstelen."

De oplossing is volgens hem niet om dan maar geen Big Data te doen. "Die keuze is er niet. Wat wèl moet gebeuren is dat de regels verwerkt worden in de systemen. Op die manier kun je voorkomen dat ongewenste gegevens naar buiten komen. Systemen moeten slimmer gemaakt worden in het contextualiseren van verbanden: wat is wel en wat is niet gewenst? Daar is discussie over, want wat de een wil, wil de ander niet. Er is op dat gebied geen waarheid. We gaan de komende tijd nog wel wat problemen meemaken op Big Data-gebied. We komen tot privacy by disaster, dat durf ik wel te voorspellen."

Praktisch advies

Buytendijk pleit voor een moreel en ethisch debat binnen bedrijven, en over bedrijfstakken heen, waarin wordt gesproken over de vraag wat goed en wat niet goed is. "Daar is niet één antwoord op, maar die discussie moet wel gevoerd worden, je moet er over nadenken. Het is zaak dat de CIO daarin het voortouw neemt. Dat zit besloten in de naam Chief Information Officer. In die discussie gaat het niet in de eerste plaats om wat er fout kan gaan, maar om de intentie. Dáár moet volgens mij het debat over gaan. Uiteindelijk gaat het om één ding: je moet goed doen. Ik heb er al erg veel over gepresenteerd de afgelopen jaren, en je merkt dat dit mensen raakt. Het roept emotie bij hen op. Soms zijn ze het ermee eens, soms niet, maar er is niemand die de discussie onbelangrijk vindt.

"Om problemen te voorkomen betekent dit in de eerste plaats meer investeren in metadata, om te weten te komen wat die informatie betekent. Begin met Masterdata-management. Dat is saai, maar wel belangrijk. Als de Masterdata niet in orde zijn kun je niets combineren, de definities moeten overal hetzelfde zijn. Dat is al veel werk. Wanneer dat op orde is kun je verder."

 

 

Tags:

Big Data

Partners