Data science softwareleverancier Dataiku lanceert versie Dataiku 4.1, met een breed scala aan nieuwe en verbeterde functies die bedoeld zijn om data science, machine learning en geavanceerde analyse toegankelijk te maken. Het verbeterde softwareplatform fungeert als een centrale hub voor zowel technische als niet-technische gebruikers, om geavanceerde data science-producten als prototype te testen, uit te bouwen, op te schalen, te implementeren en te beheren.
Volgens Florian Douetteau, CEO van Dataiku, is het bedrijf gefocust op het bouwen van een platform dat een enkelvoudig knooppunt is voor de ontwikkeling van data science en machine learning binnen een onderneming. “Veel van onze klanten zetten Dataiku al in bij honderden gebruikers met diverse achtergronden, van data-engineers tot ontwikkelaars en niet-technische analisten, om geavanceerde analyses uit te voeren en om data science-oplossingen te ontwikkelen. De nieuwste release versterkt grootschalige ontwikkeling en implementatie van deze oplossingen binnen teams."
Schaalbare implementatie
Voortbouwend op de behoeften van klanten die honderden gebruikers in hun organisaties over de hele wereld hebben, is Dataiku 4.1 ontworpen om schaalbare implementatie te versnellen met behoud van krachtige kernfunctionaliteiten zoals:
- point-and-click-interfaces voor gegevensvoorbereiding en -analyse
- aanpasbare tools om geavanceerde en efficiënte data science te faciliteren
- eenvoudige oplossingen voor implementeren en bewaken van productiemodellen.
In de recente release introduceert Dataiku functies die de mogelijkheden van een voor iedereen toegankelijk platform verder uitbreiden. "Deze release speelt in op onze kracht om onze grootste klanten in staat te stellen data science-expertise te verspreiden binnen hun gehele organisatie", aldus Douetteau. "Organisaties die Dataiku grootschalig inzetten, hebben in feite een bestand aan gebruikers in een verhouding van 4:1 van niet-coderende dataspecialisten tot data scientists die Dataiku gebruiken."
Data preparation tools
Dataiku 4.1 introduceert nieuwe data preparation ‘recepten’ binnen de Dataiku grafische interface, die krachtige analytische functionaliteiten bieden aan niet-coderende gebruikers, inclusief pivoting, sorteren en splitsen van datasets. Voor coderende gebruikers biedt de release geavanceerde visualisatiebibliotheken zoals RShiny en Bokeh voor het snel creëren van interactieve webtoepassingen in dashboards. Bovendien laten RMarkdown-rapporten gebruikers eenvoudig hun resultaten buiten Dataiku delen.
Live Model Competition
Met de Dataiku 'live model competition' vergelijken gebruikers de prestaties van een batch machine learning modellen, die in realtime concurreren zonder te wachten op de volledige training van het model. Dit vermindert de trainingstijd en inzet van bronnen bij onderbreken of hervatten van de competitie. Bovendien kunnen modellen samengevoegd worden, waarbij de sterke punten van verschillende modellen worden benut door verschillende algoritmen te combineren, zonder een enkele regel code te moeten schrijven.
Geïsoleerde codeeromgevingen
Normaliter heeft een organisatie veel projecten lopen met verschillende versies van Python, R en bibliotheken. Dataiku 4.1 ondersteunt nu reproduceerbare omgevingen, die projecten op de juiste manier isoleren en de runtime-versie tijdens de implementatiefase reproduceren. Daardoor blijft de gebruikte code stabiel, ongeacht een lokale upgrade van een pakket. Dataiku 4.1 introduceert ook een veelzijdig API-knooppunt dat modellen scoort, aangepaste Python- en R-functies uitvoert, en toegang tot datasets via geparametriseerde SQL queries en database lookups. Dataiku 4.1 biedt verder een uitgebreide toolkit voor plug-ins.
Meer informatie over Dataiku 4.1.
Download de try out versie.
7 november (online seminar op 1 middag)Praktische tutorial met Alec Sharp Alec Sharp illustreert de vele manieren waarop conceptmodellen (conceptuele datamodellen) procesverandering en business analyse ondersteunen. En hij behandelt wat elke data-pr...
11 t/m 13 november 2024Praktische driedaagse workshop met internationaal gerenommeerde trainer Lawrence Corr over het modelleren Datawarehouse / BI systemen op basis van dimensioneel modelleren. De workshop wordt ondersteund met vele oefeningen en pr...
18 t/m 20 november 2024Praktische workshop met internationaal gerenommeerde spreker Alec Sharp over het modelleren met Entity-Relationship vanuit business perspectief. De workshop wordt ondersteund met praktijkvoorbeelden en duidelijke, herbruikbare ...
26 en 27 november 2024 Organisaties hebben behoefte aan data science, selfservice BI, embedded BI, edge analytics en klantgedreven BI. Vaak is het dan ook tijd voor een nieuwe, toekomstbestendige data-architectuur. Dit tweedaagse seminar geeft antwoo...
De DAMA DMBoK2 beschrijft 11 disciplines van Data Management, waarbij Data Governance centraal staat. De Certified Data Management Professional (CDMP) certificatie biedt een traject voor het inleidende niveau (Associate) tot en met hogere niveaus van...
3 april 2025 (halve dag)Praktische workshop met Alec Sharp [Halve dag] Deze workshop door Alec Sharp introduceert conceptmodellering vanuit een non-technisch perspectief. Alec geeft tips en richtlijnen voor de analist, en verkent datamodellering op c...
10, 11 en 14 april 2025Praktische driedaagse workshop met internationaal gerenommeerde spreker Alec Sharp over herkennen, beschrijven en ontwerpen van business processen. De workshop wordt ondersteund met praktijkvoorbeelden en duidelijke, herbruikba...
15 april 2025 Praktische workshop Datavisualisatie - Dashboards en Data Storytelling. Hoe gaat u van data naar inzicht? En hoe gaat u om met grote hoeveelheden data, de noodzaak van storytelling en data science? Lex Pierik behandelt de stromingen in ...
Deel dit bericht