22-10-2015

Harriet Fryman (IBM): "The rise of Data Science is happening."

Deel dit bericht

Het gaat allemaal om het vinden van patronen en vervolgens om wat je met de informatie doet. Zie hier beknopt de filosofie van Harriet Fryman van IBM, als keynotespreekster aanwezig op de drukbezochte Big Data Expo in de Jaarbeurs. BI-Platform raakte met haar in een geanimeerd gesprek over het IBM analytics portfolio, de opkomst van de dataprofessional en de laatste ontwikkelingen rondom Spark.

Harriet Fryman is Vice President Portfolio Marketing van IBM Analytics en verantwoordelijk voor de algemene marktstrategie en de promotie van het IBM Analytics Platform. Begonnen als schrijfster van algoritmes is zij na bijna drie decennia een veteraan in Business Intelligence en Analytics. Ze bekleedde leiderschapsposities in ontwikkeling, product management, marketing en ruim tien jaar op het gebied van klantondersteuning bij implementaties. Daarbij is het haar missie om klanten relevante informatie te leveren voor een effectieve bedrijfsvoering en transformatie van hun vakgebied. Als woordvoerster van IBM over trends in Big Data en Analytics en de waarde van convergentie tussen Cloud, Mobile en Social vertelde Fryman tijdens de Big Data Expo over hoe bedrijven hun data inzichtelijk kunnen krijgen met behulp van Analytics en de rol van de data scientist daarin.

Opkomst van de dataprofessional
In haar keynote benadrukte Harriet Fryman dat data-analyse voor bedrijven waarde kan opleveren. Data, analytics en computers zijn voor iedereen beschikbaar maar wat pas onderscheidend is, is nieuwsgierigheid. Wat doen we om voordeel uit data te halen en welke voorspellingen kunnen we extrapoleren? Daarom is een omslag nodig naar een cultuur van nieuwsgierigheid waarin men onbevangen vragen mag stellen, want op die manier kan Analytics strategisch ingezet worden. Binnen zo’n cultuur van nieuwsgierigheid is een nieuw type dataprofessional op zijn plaats, de data scientist of data engineer die inzichten verschaft en binnen applicaties toepast.
Momenteel vindt volgens Fryman een paradigmaverschuiving plaats, waarin we van op data gebaseerde menselijke beslissingen gaan naar inzicht genererende applicaties en processen. Als gevolg daarvan zijn nieuwe verdienmodellen te bedenken, bijvoorbeeld op basis van schaarste. In San Francisco gelden nu variabele parkeertarieven die afhankelijk zijn van het aantal beschikbare parkeerplaatsen en daardoor meer opleveren. Analytics die realtime in het business proces zijn ingebed maken dit mogelijk. En de race naar inzicht is nog maar net begonnen.

Analytics operating system
Gevraagd naar de rol van de dataprofessional steekt Harriet Fryman vlot van wal. “Als we kijken naar de ontwikkeling van Business Intelligence zien we twee partijen: IT beheert data en rapporteert, de business neemt beslissingen. Nu zien we een derde partij ontstaan: de dataprofessional die de data interpreteert. Dit betekent de opkomst van de data scientist of data engineer en volgens IDC is de groei van deze beroepsgroep enorm. De data scientist kan algoritmes schrijven, hij kan de intelligentie ook in applicaties inbouwen waardoor het systeem kan leren en herkennen (machine learning). In het IBM portfolio betekent de inzet van Spark dat de data scientist hiervoor de mogelijkheden wordt geboden.”
“Wij beschouwen Spark als een platform dat de toegang tot data, die uit verschillende bronnen komt, verenigt met algoritmeontwikkeling, patrooninterpretatie en het vermogen om verkregen inzicht eenvoudig in applicaties, processors of apparaten (IoT) toe te passen. De data engineer kent de data, de data scientist schrijft een adequaat algoritme en de ontwikkelaar verenigt alles in een applicatie op een uniek platform. Daarom noemen wij het een ‘analytics operating system’. In de tijd voor Spark werkte iedereen nog met zijn eigen tool, in een eigen programmeertaal.”

Expertise opbouwen
Zij vervolgt: “Wat wij in juni in feite hebben aangekondigd is dat we een machine learning engine uit onze IBM ontwikkellabs als open source beschikbaar stellen. De business user echter zal Spark nooit zien, Spark is een tussenlaag die toegang geeft tot data waar deze maar zit, al of niet in databases. Spark is namelijk de ene kant van het spectrum, voor de dataprofessionals, aan de andere kant van het spectrum zit Watson Analytics. Watson Analytics is een applicatie in de Cloud, welke de business kan vullen met data van allerlei oorsprong, en Watson Analytics laat daar algoritmes op los en toont interessante verbanden op een visuele manier.”
Over de Data Science Studio onthult Harriet Fryman: “We hebben de ambitie uitgesproken om wereldwijd een miljoen data scientists en dataprofessionals op te leiden, omdat er tekort is aan expertise. Vandaar de opening van de IBM Data Science Studio’s, waar we data science expertise willen opbouwen en samen met onze klanten aan oplossingen werken. De eerste Studio is geopend in Columbus, de tweede in Amsterdam en we zijn van plan er mondiaal nog zes op te starten. IBM dataprofessionals werken in de Studio met een klant twee tot vier weken intensief samen om stevige problemen tot inzicht om te buigen.”
En “it is all about finding patterns and what you do with that information,” zo besluit zij lachend.

biplatform afbeelding Harriet Fryman: “The rise of Data Science is happening.”


Spark
Wat betreft architectuurplatform staan bij IBM twee technologieën centraal: bouwen voor de Cloud en voor Spark. Sinds juni 2015 is IBM sterk toegewijd aan Spark, het snelst groeiend Apache-project. (Hier informatie over de Spark Summit in Amsterdam). Dit open source platform faciliteert de data engineer en de applicatieontwikkelaar in hun samenwerking bij het ontsluiten van data en de ontwikkeling van algoritmen, met als uitkomst intelligente analytische applicaties.

Amsterdam IBM Data Science Studio
IBM heeft twee Data Science Studio’s voor analytics opgezet, een in Columbus, Ohio en sinds enkele weken een in Amsterdam. De missie van IBM’s Data Science Studio is ontwerp, bouw en implementatie van gevarieerde en geavanceerde analytics oplossingen voor IBM’s klanten in diverse bedrijfstakken. Naast samenwerking met klanten aan hun problemen dient de Data Science Studio ook als een intellectuele hub om klanten, analyse-experts, onderzoekers en academici in het data science-vakgebied bij elkaar te brengen.


Partners