De hoeveelheid data en informatie die ons tegenwoordig ter beschikking staat, is veel te groot om nog door mensen te analyseren. We gooien daarom noodgedwongen een heleboel informatie ongezien weg. Wat, als we nu met behulp van slimme software en systemen wel in die grote bakken met data kunnen kijken en door middel van geautomatiseerde analyse de juiste beslissingen kunnen nemen? “Dat is Smarter Analytics”, zegt de expert bij IBM.
“Smarter Analytics is een optelsom van wat we in het verleden deden en in de toekomst gaan doen. Iedereen, elk bedrijf, elke organisatie, is nu bezig met wat wij noemen beschrijvende of ‘descriptive analytics’, ook wel bekend als BI, Business Intelligence. Met BI kijk je in het verleden. Je trekt daaruit conclusies en probeert op basis daarvan het volgende jaar bijvoorbeeld betere resultaten te bereiken.” Aan het woord is Dagmar Klaassen, Technical Teamleider Business Analytics bij IBM, die met ruim tien jaar Business Analytics-ervaring, alle belangrijke recente ontwikkelingen op het vakgebied heeft meegemaakt. “Een jaar of vijf geleden hebben we bij IBM die beschrijvende analyse uitgebreid door er ‘predictive’ aan toe te voegen”, zet hij zijn betoog gedreven voort. “Predictive houdt in op basis van patronen die ergens in jouw informatie verborgen zitten, voorspellen wat er waarschijnlijk gaat gebeuren. Dat is al een duidelijke stap vooruit richting Smarter Analytics. Voor Smarter Analytics is echter nog een derde stap vereist in de vorm van wat wij noemen ‘prescriptive analytics’. Dat is niet alleen voorspellen wát gaat er gebeuren, maar ook aangeven waarom en wanneer iets gaat gebeuren.”
Een voorbeeld dat Klaassen aanvoert, is onderhoud aan grote machines, zoals vliegtuigen. Het zou handig zijn als vliegtuigmaatschappijen uit de gigantische berg aan informatie waarover zij beschikken bijvoorbeeld kunnen achterhalen: na honderdduizend vlieguren moet deze bout worden vervangen; en als we die bout vervangen, moeten we die kabel ook meteen vervangen, omdat het systeem uit onze data heeft gedestilleerd dat die kabel vijfduizend vlieguren later ook aan vervanging toe is. Vliegtuigen horen zoveel mogelijk in de lucht thuis en niet op de grond in onderhoud. Dus hoe meer dat beperkt kan worden, hoe beter het is. Hetzelfde geldt voor treinen. Al dat soort organisaties kunnen zo flink geld besparen. “Dat is wat wij bedoelen met Smarter Analytics: kijken in het verleden, voorspellen wat de toekomst ons gaat brengen en vervolgens ook nog kunnen aangeven wanneer het gaat gebeuren en waarom. Dat halen we allemaal uit grote hoeveelheden data en informatie, gestructureerd en ongestructureerd. Onder data verstaan we dan vooral het gestructureerde deel, dus gegevens opgeslagen in een of meerdere databases. Terwijl we bij informatie primair denken aan ongestructureerde gegevens, vervat in documenten.”
Tools
Als belangrijkste tools op dit gebied heeft IBM voor de BI-kant Cognos. Dan gaat het met name om rapportage, terugkijken. Voor het predictive-stuk heeft IBM SPSS, terwijl de combinatie een set van producten oplevert waarmee op basis van via modeling blootgelegde patronen, prescriptive aan de manager van bijvoorbeeld een onderhoudsteam kan worden doorgegeven, wanneer wat moet worden vervangen. “We gebruiken overal de standaard componenten voor”, aldus Klaassen, “die met elkaar ons Business Analytics-platform vormen. Maar daaraan kan bijvoorbeeld ook weer een stuk workflow worden gekoppeld: als die uitzonderingssituatie optreedt, moeten deze twee mensen worden gewaarschuwd en moet dit proces worden gestart. Dat kun je door persoonlijk ingrijpen doen via e-mails, maar dat kun je ook geautomatiseerd laten plaatsvinden. Op dat moment zit die Smarter Analytics-motor als het ware midden in je proces .”
De term ‘modeling’ is gevallen, in samenhang met SPSS, dat vereist enige nadere toelichting. Klaassen: “SPSS is begonnen als een tool voor statistische analyse. Daar is een datamining-omgeving aan toegevoegd. Er zitten een aantal intelligente elementen in, waarmee op basis van een testdataset een model wordt gebouwd. Want je moet natuurlijk weten wat een bepaald algoritme gaat doen; wat hij controleert of wat hij scoort, wat de samenhang is tussen variabelen, óf er samenhang is tussen variabelen. Alle stappen die een mens doet, zijn ook gebaseerd op onderliggende kennis. Jij weet dat bepaalde zaken gebeuren, op bepaalde momenten, onder bepaalde voorwaarden, omdat dat ergens in je hoofd ligt opgeslagen. Dat heb je een keer ervaren. Die mining-software kan dat er zelf uithalen. Dat zijn de modellen. Die achterhaalt bijvoorbeeld dat leeftijd en inkomen invloed hebben op de aankoop van een type auto en sekse helemaal niet. Die software is zelflerend en wordt gevoed met alle relevante data die maar beschikbaar is.”
Datakwaliteit
Alle Business Analytics valt en staat natuurlijk met de kwaliteit van de data waarmee gewerkt wordt. Ook daarvoor heeft IBM het nodige in huis, zo laat Klaassen zien op het bord dat aan de wand hangt. Hij schetst een gelaagd systeem met dataopslag (voor de gestructureerde data is dat bij IBM natuurlijk DB2) aan de basis en daarbovenop een IM-laag (Information Management), die de data beschrijft, de kwaliteit ervan bepaalt en die kwaliteit desgewenst verbetert. “Dat gaat met name over gestructureerde data”, licht Klaassen toe, “want ongestructureerde data op zich kun je niet goed verbeteren of schoonmaken. Daar bovenop zit de rapportage en de voorspelling: Cognos, SPSS en nog een paar productgroepen. Dat hele conglomeraat tezamen heet bij ons dus Smarter Analytics. En rond Smarter Analytics heeft IBM dan nog de mensen die de nodige kennis in huis hebben. Niet alleen van de producten, maar ook van de diverse bedrijfssectoren, de sectorspecialisten op gebieden als health care, overheid, industrie, et cetera.”
Ter afsluiting zoomen we nog even in op een grafiekje dat Klaassen en passant op het bord heeft gezet en dat de verwachte exponentiële groei van data in beeld brengt die ons de komende jaren te wachten staat. Kan IBM dat straks met al zijn technologie nog wel bijbenen? “De tijd zal het leren, maar ik ben hoopvol gestemd, zegt Klaassen. “We zijn nu nog bereid om alles op te slaan. Maar 80 procent van wat ik opsla is niet interessant, dat gebruik ik nooit meer. Veel informatie afkomstig van sensoren is alleen in het hier en nu van belang. We hebben elk jaar meer dan een verdubbeling van het aantal sensoren. Straks zitten ze in je voetbal om te registreren hoe vaak hij stuitert. Prima, het is voor een bepaalde groep even interessant, maar dan niet meer. En als dat het geval is, heeft het geen waarde om die data nog op te slaan en zullen we dat dus ook niet meer doen.”
Door Dick Schievels
7 november (online seminar op 1 middag)Praktische tutorial met Alec Sharp Alec Sharp illustreert de vele manieren waarop conceptmodellen (conceptuele datamodellen) procesverandering en business analyse ondersteunen. En hij behandelt wat elke data-pr...
11 t/m 13 november 2024Praktische driedaagse workshop met internationaal gerenommeerde trainer Lawrence Corr over het modelleren Datawarehouse / BI systemen op basis van dimensioneel modelleren. De workshop wordt ondersteund met vele oefeningen en pr...
18 t/m 20 november 2024Praktische workshop met internationaal gerenommeerde spreker Alec Sharp over het modelleren met Entity-Relationship vanuit business perspectief. De workshop wordt ondersteund met praktijkvoorbeelden en duidelijke, herbruikbare ...
26 en 27 november 2024 Organisaties hebben behoefte aan data science, selfservice BI, embedded BI, edge analytics en klantgedreven BI. Vaak is het dan ook tijd voor een nieuwe, toekomstbestendige data-architectuur. Dit tweedaagse seminar geeft antwoo...
De DAMA DMBoK2 beschrijft 11 disciplines van Data Management, waarbij Data Governance centraal staat. De Certified Data Management Professional (CDMP) certificatie biedt een traject voor het inleidende niveau (Associate) tot en met hogere niveaus van...
3 april 2025 (halve dag)Praktische workshop met Alec Sharp [Halve dag] Deze workshop door Alec Sharp introduceert conceptmodellering vanuit een non-technisch perspectief. Alec geeft tips en richtlijnen voor de analist, en verkent datamodellering op c...
10, 11 en 14 april 2025Praktische driedaagse workshop met internationaal gerenommeerde spreker Alec Sharp over herkennen, beschrijven en ontwerpen van business processen. De workshop wordt ondersteund met praktijkvoorbeelden en duidelijke, herbruikba...
15 april 2025 Praktische workshop Datavisualisatie - Dashboards en Data Storytelling. Hoe gaat u van data naar inzicht? En hoe gaat u om met grote hoeveelheden data, de noodzaak van storytelling en data science? Lex Pierik behandelt de stromingen in ...
Deel dit bericht