Op 25 april 2017 lanceerden het Centrum Wiskunde & Informatica (CWI) en het big data analyse- en data science software-bedrijf Databricks een nieuwe samenwerking. Dit gebeurde tijdens de Hannover Messe, de grootste jaarlijkse technologiebeurs ter wereld, in aanwezigheid van Minister Kamp van Economische Zaken.
Speciaal voor de samenwerking met het CWI, en voor het database engineering-talent ter plekke, opende Databricks eerder dit jaar een R&D-centrum in Amsterdam. Het bedrijf uit San Francisco leidt de ontwikkeling van de open-source software Apache Spark, wereldwijd de meest gebruikte softwaretool om grote hoeveelheden data te analyseren. Databricks biedt Spark aan als service in de cloud: met Spark kunnen bedrijven en organisaties efficiënt en effectief hun data analyseren in een beheerde omgeving.
Databricks financiert onderzoek in de Database Architectures-groep van CWI, de onderzoeksgroep die eerder de bekende databasesystemen VectorWise en MonetDB ontwikkelde. De CWI-onderzoekers werken aan database-technieken die voor Databricks interessant kunnen zijn. Het gaat om methoden waarmee gebruikers grote hoeveelheden data kunnen analyseren, waarbij het niet alleen om tabellen hoeft te gaan, maar ook om (sociale) netwerken met groeiende en veranderlijke gegevens.
Verrijking van het data science-ecosysteem
Peter Boncz, senior researcher in de Database Architectures-onderzoeksgroep, coördineert de samenwerking. Boncz: “De komst van Databricks naar Amsterdam is een verrijking van het lokale data science-ecosysteem en het onderstreept de reputatie van het CWI op het gebied van big data-technologie.” Boncz ziet duidelijke kansen voor het fundamentele CWI-onderzoek: “Voor CWI levert de samenwerking de kans op om achter de schermen mee te kijken bij Databricks. We krijgen inzicht in de grote diversiteit aan data-analyse-problemen waarmee gebruikers worstelen, en ontdekken zo de open vragen op het gebied van data-analyse. Daarnaast zijn bij Databricks professoren van Berkeley en Stanford betrokken, dus er ontstaan ook nieuwe wetenschappelijke samenwerkingen.”
Sneller en meer schaalbaar
Databricks kijkt er volgens Ram Sriharsha, interim vestigingsmanager van het Amsterdamse R&D-center van Databricks, naar uit haar R&D-aanwezigheid in Amsterdam te versterken en baanbrekend werk te verrichten op het gebied van big data-analyse en data science. “De samenwerking met het CWI, en met name de expertise van het CWI op het gebied van high-performance databases, was doorslaggevend bij onze keuze voor Amsterdam. We hopen dat we dankzij deze samenwerking Spark en Databricks sneller en schaalbaarder kunnen maken.”
Foto: Peter Boncz (CWI, links), minister Kamp en Ram Sriharsha (Databricks, rechts) bij de lancering van de samenwerking.
7 november (online seminar op 1 middag)Praktische tutorial met Alec Sharp Alec Sharp illustreert de vele manieren waarop conceptmodellen (conceptuele datamodellen) procesverandering en business analyse ondersteunen. En hij behandelt wat elke data-pr...
11 t/m 13 november 2024Praktische driedaagse workshop met internationaal gerenommeerde trainer Lawrence Corr over het modelleren Datawarehouse / BI systemen op basis van dimensioneel modelleren. De workshop wordt ondersteund met vele oefeningen en pr...
18 t/m 20 november 2024Praktische workshop met internationaal gerenommeerde spreker Alec Sharp over het modelleren met Entity-Relationship vanuit business perspectief. De workshop wordt ondersteund met praktijkvoorbeelden en duidelijke, herbruikbare ...
26 en 27 november 2024 Organisaties hebben behoefte aan data science, selfservice BI, embedded BI, edge analytics en klantgedreven BI. Vaak is het dan ook tijd voor een nieuwe, toekomstbestendige data-architectuur. Dit tweedaagse seminar geeft antwoo...
De DAMA DMBoK2 beschrijft 11 disciplines van Data Management, waarbij Data Governance centraal staat. De Certified Data Management Professional (CDMP) certificatie biedt een traject voor het inleidende niveau (Associate) tot en met hogere niveaus van...
3 april 2025 (halve dag)Praktische workshop met Alec Sharp [Halve dag] Deze workshop door Alec Sharp introduceert conceptmodellering vanuit een non-technisch perspectief. Alec geeft tips en richtlijnen voor de analist, en verkent datamodellering op c...
10, 11 en 14 april 2025Praktische driedaagse workshop met internationaal gerenommeerde spreker Alec Sharp over herkennen, beschrijven en ontwerpen van business processen. De workshop wordt ondersteund met praktijkvoorbeelden en duidelijke, herbruikba...
15 april 2025 Praktische workshop Datavisualisatie - Dashboards en Data Storytelling. Hoe gaat u van data naar inzicht? En hoe gaat u om met grote hoeveelheden data, de noodzaak van storytelling en data science? Lex Pierik behandelt de stromingen in ...
Deel dit bericht