25-08-2017 Door: Bart Plooij

Fleur Hasaart over inzet data science bij zorgverzekeraar CZ

Deel dit bericht

Hoe de inzet van big data de processen bij een grote zorgverzekeraar verandert, is het onderwerp van de keynote die Fleur Hasaart houdt tijdens de Big Data Expo op woensdag 20 september. Fleur Hasaart is Manager Data Science bij zorgverzekeraar CZ en geeft leiding aan een data science team dat bezig is om met nieuwe technieken allerlei bestaande processen te optimaliseren, maar ook verder kijkt naar nieuwe mogelijkheden. Zij wilde aan BI-Platform alvast een en ander vertellen over de werkwijze en de eerste resultaten binnen CZ.

CZ is een in Tilburg gevestigde zorgverzekeraar die drieëneenhalf miljoen verzekerden in haar klantenbestand heeft. Per jaar verwerkt het bedrijf 3,6 miljoen telefoontjes en 220 miljoen declaraties. "In vijf jaar tijd aan behandeling van zorgkosten, dan heb je het dus over een miljard records in onze systemen", schetst Fleur Hasaart de omvang van de data in beheer bij CZ.

Data-analyse
Haar data science afdeling is begin 2017 opgericht als een nieuwe en aparte divisie, omdat CZ heeft geconstateerd dat er door de komst van big data en data science-technieken veel meer mogelijk is met gebruik van de data die het bedrijf in bezit heeft of door het verzamelen van nieuwe data.
Ook is de noodzaak ingezien om deze data ergens gecentraliseerd neer te zetten. "We hebben best al veel data-analisten in dienst, die allemaal voor hun eigen business unit werken. Maar omdat het over nieuwe kennis en nieuwe technieken gaat, heeft CZ gekozen voor een centrale afdeling."

Hasaart heeft gezondheidseconomie gestudeerd en is gepromoveerd op een onderzoek naar Diagnose Behandel Combinaties, gebaseerd op data die door haar werkgever CZ zijn verstrekt. Zij werkte destijds bij CZ op de Business Intelligence afdeling en deed ongeveer zestig procent van de tijd onderzoek en veertig procent van haar tijd maakte ze query's. "Het was fijn om op die plek te zitten want het was heel dicht bij de data. Mijn onderzoek ging over empirisch bewijs vinden naar afwijkende financiële prikkels binnen de financiering van het DBC-systeem. Dat zie je eigenlijk met ieder financieringssysteem; na een tijdje ga je kijken naar hoe het werkt en dan ga je het evalueren. Dat doe je het liefst met behulp van data-analyse en CZ beschikte over heel veel data."

Service naar klanten
Haar keynote op de Big Data Expo gaat over hoe data science een zorgverzekeraar kan veranderen. Fleur Hasaart constateert dat je door data science bijvoorbeeld heel anders kan omgaan met de service naar klanten toe. "Je kan misschien veel beter voorspellen welke vragen iemand heeft en wanneer welke vragen komen, verder hoe je mensen het beste kan benaderen, zowel online als bijvoorbeeld aan de telefoon. Aan dergelijke voorbeelden zou je kunnen denken: klantcontactcenters die de next-best-question voorspellen. Ook gaan wij wat experimenten doen met speech-to-text en in een latere fase willen we ook nog met emotieherkenning aan de slag gaan." De bedoeling is dus om nieuwe technieken in te zetten om onder andere de klantenservice te optimaliseren, bevestigt Hasaart.

De keynote die zij tijdens de Big Data Expo geeft wordt gesponsord door het in Tilburg gevestigde bedrijf Building Blocks. "Building Blocks heeft CZ eerst een jaar geholpen bij het Data Science Lab, zoals we dat hebben genoemd. Daarin hebben we met hen gekeken naar wat CZ zou kunnen doen op het gebied van data science. Een voorbeeld daarvan is om bij het klantcontact te kijken naar waarover die gesprekken precies gaan, zodat je veel beter kan destilleren waarvoor je medewerkers moet opleiden en je misschien proactief kan zorgen dat het aantal vragen verminderd wordt. Building Blocks doet dus allerlei projecten voor ons, maar ook met ons."

Betaalproces
De inzet van big data en data science verandert de bestaande processen bij CZ. Dat is een 'ongoing process’, aangezien het bedrijf natuurlijk hiermee nog maar net is begonnen. Hasaart geeft als voorbeeld dat er veel meldingen van verzekerden binnen komen met een vraag over een nota. En tegelijkertijd komen er ook iedere dag weer nieuwe nota's binnen.
"Wat we nu doen is leren van al die meldingen die de verzekerden hebben gedaan en we hebben een netwerk getraind dat op al de nieuwe binnenkomende nota's die nota's eruit kan halen, waarover verzekerden misschien ook vragen zullen hebben. De bedoeling is om deze in eerste instantie aan de verzekerden voor te leggen voordat we ze uitbetalen. Het betaalproces van de nota's is natuurlijk een van onze belangrijkste processen, dus als je dat op die manier anders gaat vormgeven, dan is dat denk ik een goed voorbeeld."

Fleurt Hasaart benadrukt de missie van CZ: alles voor betere zorg. Dat kan CZ doen door klanten naar de juiste diensten te begeleiden, door goed in te kopen, en data science kan helpen bij een aantal van deze onderdelen. “Zo kan de inzet van data science ons helpen om tevredenheid omhoog te krijgen, om zorgkosten omlaag te brengen, om de kwaliteit van de zorg te verbeteren, of om onze interne kosten te verlagen. Data science wordt daarmee niet als doel gesteld, maar is een middel om onze bedrijfsdoelen te realiseren.”

Resultaten
Hasaart wil graag wat vertellen over de eerste resultaten, nadat in de eerste maanden vooral gewerkt is aan een beschrijving van het proces en de vormgeving. "Mijn afdeling is eigenlijk een soort van prototype-fabriekje, waarin we kortcyclisch willen laten zien wat je zou kunnen als je datagedreven naar een probleem kijkt. Een aantal van die prototypes is succesvol, en soms leer je dat ergens niet genoeg data voor is of dat je niet de juiste techniek ervoor hebt.
Wat een goed voorbeeld is van waar we wel iets mee kunnen is dat we in staat zijn om beter het onderwerp uit een klantvraag te destilleren, om te kunnen voorspellen wat de volgende vraag zou kunnen zijn. Een ander voorbeeld van resultaat is dat we proberen om beter in te schatten hoe de zorgkosten zich gaan ontwikkelen, zodat we daarmee goed rekening kunnen houden in het stellen van onze premie. Dat zijn denk ik de twee belangrijkste resultaten."

Verder constateert Hasaart dat het meest onverwachte verkregen inzicht is dat kortcyclisch experimenteren heel goed werkt, ook bij een bedrijf als CZ. "Dat is het ‘act fast, fail fast’ principe. Door met zijn allen heel toegewijd te werken heb je veel sneller door of iets waarde gaat creëren of niet."

Big Data tools
Fleur Hasaart beschrijft drie rollen in haar team met data scientists. "We erkennen de data scientist, de data engineer en de data translator. De translator is daarbij de verbinder tussen de business en het data science team, de engineer is de verbinder tussen alle bronsystemen en de data scientist, en de data scientist schrijft de algoritmen."
Zowel een eigen Hadoop-cluster als een relationeel databasesysteem zijn bij CZ Zorgverzekeraars in gebruik. De traditionele Business Intelligence omgeving, waaronder de analisten in de diverse business units als marketing, zorg en controleafdeling, werkt met SAS. Het team van Hasaart echter werkt met allerlei big data tools; met R, Python en neuraal netwerk-tool Weka. Hasaart verklaart dat CZ hiervoor heeft gekozen, omdat ze veel jonge mensen in haar team heeft die net van hun opleiding komen. "Zij hebben een voorkeur om met open source tooling te werken en dat hebben we ze laten doen."
Tot op heden verloopt de werving van data scientists volgens Hasaart goed. Het is een relatief klein team, met zes werknemers en nog drie stagiairs.

Apache Spark
Bij CZ is nog geen data lake in gebruik. Volgens Hasaart wordt er nog binnen het bedrijf nagedacht of men over gaat op een data lake, al of niet via de cloud. Voor de analyse op big data wordt Apache Spark ingezet en de ervaringen hiermee zijn positief. "We zijn er tevreden over, maar ik moet zeggen dat we ook nog heel veel daarvan los van Hadoop, los van Spark, kunnen doen door de data die we nodig hebben op een server te zetten, en rechtstreeks op een file server onze query’s uit te voeren. We doen onze analyses dus niet allemaal per se via Spark."
Hasaart antwoordt daarbij dat CZ nog niet zo ver is om real-time met een combinatie van gestructureerde data en data uit allerlei online bronnen en streams te gaan werken. "Maar daarover zijn we wel aan het brainstormen, dat zijn zaken waarover we nadenken."

Onderzoekslijnen JADS
Fleur Hasaart meldt verder dat het interessant is om te weten dat CZ ook samenwerkt met JADS in Den Bosch, de eind 2016 geopende Jheronimus Academy of Data Science, waarin de Technische Universiteit Eindhoven en de Tilburg University samenwerken met het bedrijfsleven in de regio Brabant. "Wij zien namelijk dat het gebruik van big data en data science-technieken naast heel veel slimme optimalisaties ook tot meer disruptie zou kunnen leiden. We laten ons graag helpen door de universiteit bij hoe we daarmee moeten omgaan en waaraan we dan kunnen denken, om ons vanuit onderzoek te laten assisteren bij wat er allemaal kan en wat je daarin zou moeten willen en wat ook niet."

Tenslotte vertelt zij dat er twee onderzoekslijnen zijn neergelegd bij JADS. "De ene heet Disruptie en zorgverzekeraar, en de ander Personalisatie in de zorg. Daar komen twee bijzonder hoogleraren op en twee PhD-studenten. Met hen samen gaan we die onderzoekslijnen invullen."

Fleur Hasaart houdt haar keynote op woensdag 20 september om 15.00 uur tijdens de Big Data Expo in de Jaarbeurs Utrecht.

Partners