12-06-2020

Data Science op afstand: hoe zorg je dat het werkt?

Deel dit bericht

Werken op afstand is de ultieme lakmoesproef als het gaat om het testen van de robuustheid van een data-organisatie. De uitdagingen waarmee teams te maken krijgen zijn legio. Neem alleen al het feit dat samenwerken vaak eenvoudiger is als als je fysiek bij elkaar zit. Ook mis je door remote te werken waardevolle informatie die dikwijls wordt gedeeld in informele gesprekken bij de koffieautomaat. Maar als een organisatie goed is ingericht om data science-projecten op afstand uit te voeren, zijn er ook zeker voordelen.

De uitdagingen van data science op afstand
Een datateam dat wordt gefaciliteerd om vanaf verschillende locaties buiten kantoor efficiënt te werken, biedt nieuwe mogelijkheden voor productiviteit; maar brengt ook uitdagingen met zich mee, namelijk:

- Toegang tot systemen
Verbinding maken met onderliggende datasystemen kan een uitdaging zijn in een thuiswerkomgeving. Of het nu gaat om toegang tot de verschillende databronnen of rekenkracht, het is in veel gevallen lastiger om dit op afstand te doen.

- Samenwerking binnen teams
Dataprojecten worden zelden door één persoon uitgevoerd. Ook is samenwerking in een team het makkelijkst als je bij elkaar zit. Zonder deze fysieke nabijheid worden deeltaken binnen het project in silo’s uitgevoerd wat ten koste gaat van een goede executie en de kwaliteit van het project.

- Samenwerking tussen verschillende teams
Dataprojecten gaan niet alleen over data, maar vereisen ook een sterke betrokkenheid van teams met collega’s uit de business. Zo kun je waardevolle input meenemen, draagvlak creëren en zorgen dat de resultaten van je project voldoende relevant zijn. Ook is er samenwerking nodig met data engineering en andere teams om te helpen met operationele zaken van het project. Een situatie waarin iedereen volledig vanuit huis werkt en samenwerking niet voldoende wordt gefaciliteerd, kan een goede uitvoering van een project dan ook belemmeren.

- Hergebruik
Om de productiviteit en efficiëntie te verhogen, is het essentieel te kunnen profiteren van projecten die in het verleden zijn uitgevoerd. Het hergebruik binnen grote code repositories manifesteert zich echter vaak informeel en het gebrek aan een laagdrempelige discussie kan het hergebruiken van werk uit het verleden aanzienlijk beperken.

Drie voordelen van remote data science
Een van de belangrijkste trends van de afgelopen jaren en zeker in de tumultueuze wereld van 2020, is het faciliteren van thuiswerken of locatieonafhankelijk werken. Er zijn drie belangrijke redenen waarom dit ook voor data science-projecten zakelijk interessant is.

1. Het opent deuren naar datatalent dat niet in de buurt woont. In het onderzoeksrapport State of Remote Work, zegt 99 procent van de respondenten dat ze voor de rest van hun carrière in ieder geval graag gedeeltelijk zouden willen thuiswerken. Als de mogelijkheid van thuiswerken niet wordt geboden aan data professionals betekent dit dat je veel talent bij voorbaat uitsluit. Dit geeft organisaties een mogelijkheid om zich te onderscheiden van concurrenten in de branche en bedrijven die zich ook richten op hetzelfde datatalent.

2. Het meeste datatalent in wereldwijde organisaties werkt sowieso vanaf verschillende locaties. Datateams bij bedrijven zitten zelden in hetzelfde kantoor of in hetzelfde land. Het faciliteren van locatieonafhankelijk werken helpt niet alleen degenen die altijd thuiswerken, maar stimuleert tegelijkertijd best practices die gedistribueerde teams verder kunnen helpen en helpt om verschillende datateams samen te brengen.

3. Het maakt bedrijven flexibeler zodat als er zich onvoorziene omstandigheden voordoen, ze zich kunnen aanpassen zonder data science en machine learning projecten (en dus AI-strategie en voortgang) te vertragen. Dit is vooral van belang wanneer organisaties volwassener worden op het gebied van AI en hun dataprojecten zijn gericht op belangrijke bedrijfsactiviteiten. Het onderbreken van deze projecten is dan mogelijk desastreus. Bijvoorbeeld als een retailer een pricing model gebaseerd op machine learning in productie heeft, moet dit continu geëvalueerd worden. Dit proces ontwrichten, zeker in turbulente tijden, kan leiden tot veel omzetverlies.

Hoe richt je data science op afstand in?
Dit klinkt allemaal mooi, maar hoe kunnen organisaties er praktisch voor zorgen dat iedereen, van analist tot data manager, data engineer, data scientists en iedereen daartussen, naadloos kan samenwerken, zowel dichtbij als remote?

Kleine teams kunnen zichzelf tot een bepaald punt ondersteunen door op een ad-hoc manier aan AI-projecten te werken. Dit betekent dat teamleden hun werk lokaal en niet centraal opslaan, geen reproduceerbare processen of workflows hebben en gaandeweg dingen uitzoeken. Maar met meer dan slechts een paar teamleden en meer dan één project, of met iemand - of, gezien de huidige gebeurtenissen, iedereen - op afstand, wordt dit al snel weerbarstig.

De juiste data science-platformen maken locatieonafhankelijk werken mogelijk door mensen door de organisatie heen in toegang te geven tot data en samen te werken aan projecten op een centrale locatie. Het faciliteert goede data governance gecombineerd met verticale (data scientist met data scientist) als horizontale (analist met data scientist of business gebruiker) samenwerking.

Het juiste datateam samenstellen, of ze nou remote werken of niet, is geen eenvoudige taak. Maar met de juiste benadering voor het aannemen, opleiden en behouden van datatalent, kunnen bedrijven bouwen aan een duurzame enterprise AI-strategie. Lees hier meer over in het ebook: Staffing the AI enterprise.

Hylke Visser is Director Sales and Business Development bij Dataiku.

Partners