15-11-2017

Dataiku 4.1 centrale hub voor Analytics, Machine Learning en Data Science

Deel dit bericht

Data science softwareleverancier Dataiku lanceert versie Dataiku 4.1, met een breed scala aan nieuwe en verbeterde functies die bedoeld zijn om data science, machine learning en geavanceerde analyse toegankelijk te maken. Het verbeterde softwareplatform fungeert als een centrale hub voor zowel technische als niet-technische gebruikers, om geavanceerde data science-producten als prototype te testen, uit te bouwen, op te schalen, te implementeren en te beheren.

Volgens Florian Douetteau, CEO van Dataiku, is het bedrijf gefocust op het bouwen van een platform dat een enkelvoudig knooppunt is voor de ontwikkeling van data science en machine learning binnen een onderneming. “Veel van onze klanten zetten Dataiku al in bij honderden gebruikers met diverse achtergronden, van data-engineers tot ontwikkelaars en niet-technische analisten, om geavanceerde analyses uit te voeren en om data science-oplossingen te ontwikkelen. De nieuwste release versterkt grootschalige ontwikkeling en implementatie van deze oplossingen binnen teams."

Schaalbare implementatie
Voortbouwend op de behoeften van klanten die honderden gebruikers in hun organisaties over de hele wereld hebben, is Dataiku 4.1 ontworpen om schaalbare implementatie te versnellen met behoud van krachtige kernfunctionaliteiten zoals:
- point-and-click-interfaces voor gegevensvoorbereiding en -analyse
- aanpasbare tools om geavanceerde en efficiënte data science te faciliteren
- eenvoudige oplossingen voor implementeren en bewaken van productiemodellen.

In de recente release introduceert Dataiku functies die de mogelijkheden van een voor iedereen toegankelijk platform verder uitbreiden. "Deze release speelt in op onze kracht om onze grootste klanten in staat te stellen data science-expertise te verspreiden binnen hun gehele organisatie", aldus Douetteau. "Organisaties die Dataiku grootschalig inzetten, hebben in feite een bestand aan gebruikers in een verhouding van 4:1 van niet-coderende dataspecialisten tot data scientists die Dataiku gebruiken."

Data preparation tools
Dataiku 4.1 introduceert nieuwe data preparation ‘recepten’ binnen de Dataiku grafische interface, die krachtige analytische functionaliteiten bieden aan niet-coderende gebruikers, inclusief pivoting, sorteren en splitsen van datasets. Voor coderende gebruikers biedt de release geavanceerde visualisatiebibliotheken zoals RShiny en Bokeh voor het snel creëren van interactieve webtoepassingen in dashboards. Bovendien laten RMarkdown-rapporten gebruikers eenvoudig hun resultaten buiten Dataiku delen.

Live Model Competition
Met de Dataiku 'live model competition' vergelijken gebruikers de prestaties van een batch machine learning modellen, die in realtime concurreren zonder te wachten op de volledige training van het model. Dit vermindert de trainingstijd en inzet van bronnen bij onderbreken of hervatten van de competitie. Bovendien kunnen modellen samengevoegd worden, waarbij de sterke punten van verschillende modellen worden benut door verschillende algoritmen te combineren, zonder een enkele regel code te moeten schrijven.

Geïsoleerde codeeromgevingen
Normaliter heeft een organisatie veel projecten lopen met verschillende versies van Python, R en bibliotheken. Dataiku 4.1 ondersteunt nu reproduceerbare omgevingen, die projecten op de juiste manier isoleren en de runtime-versie tijdens de implementatiefase reproduceren. Daardoor blijft de gebruikte code stabiel, ongeacht een lokale upgrade van een pakket. Dataiku 4.1 introduceert ook een veelzijdig API-knooppunt dat modellen scoort, aangepaste Python- en R-functies uitvoert, en toegang tot datasets via geparametriseerde SQL queries en database lookups. Dataiku 4.1 biedt verder een uitgebreide toolkit voor plug-ins.

Meer informatie over Dataiku 4.1.
Download de try out versie.

Partners