Databricks kondigt de overeenkomst aan voor de overname van datamanagement-leverancier Tabular. De overname brengt de oorspronkelijke makers van Apache Iceberg en Linux Foundation Delta Lake bij elkaar, twee toonaangevende open source-formats voor data lakehouses. De teams van Databricks en Tabular zullen samen verder werken aan een open standaard voor interoperabiliteit en datacompatibiliteit, zodat organisaties niet meer beperkt worden tot specifieke dataformats.
Delta Lake en Iceberg zijn twee van de meest gebruikte open source lakehouse-formats, maar compatibiliteit wordt een steeds grotere uitdaging. Zo zijn de twee formats niet compatibel met elkaar. Bovendien worden Delta Lake en Iceberg veel gebruikt in oplossingen van derden, waarbij doorgaans voor één van de twee wordt gekozen – of er slechts een deel van het format wordt gebruikt. Dit leidt tot gefragmenteerde en gesilo’de bedrijfsdata, wat het lakehouse juist moet voorkomen.
Om de gewenste interoperabiliteit te bereiken zal Databricks nauw samenwerken met de open source-communities van Delta Lake en Iceberg. Dit is een langdurig project, dat waarschijnlijk meerdere jaren in beslag zal nemen. Als eerste stap introduceerde Databricks vorig jaar Delta Lake UniForm. UniForm-tabellen bieden interoperabiliteit tussen Delta Lake, Iceberg en Hudi en ondersteunen de Iceberg restful catalog interface, zodat bedrijven hun vertrouwde analytics engines en tools kunnen gebruiken voor al hun data. UniForm, dat vandaag algemeen beschikbaar is, stelt bedrijven in staat om compatibiliteit te bereiken. Met de toevoeging van het oorspronkelijke Iceberg-team heeft Databricks nog grotere ambities: de ontwikkeling van een enkele open standaard voor datacompatibiliteit.
De voorgestelde overname zal naar verwachting worden afgerond in het tweede fiscale kwartaal van Databricks.
7 november (online seminar op 1 middag)Praktische tutorial met Alec Sharp Alec Sharp illustreert de vele manieren waarop conceptmodellen (conceptuele datamodellen) procesverandering en business analyse ondersteunen. En hij behandelt wat elke data-pr...
11 t/m 13 november 2024Praktische driedaagse workshop met internationaal gerenommeerde trainer Lawrence Corr over het modelleren Datawarehouse / BI systemen op basis van dimensioneel modelleren. De workshop wordt ondersteund met vele oefeningen en pr...
18 t/m 20 november 2024Praktische workshop met internationaal gerenommeerde spreker Alec Sharp over het modelleren met Entity-Relationship vanuit business perspectief. De workshop wordt ondersteund met praktijkvoorbeelden en duidelijke, herbruikbare ...
26 en 27 november 2024 Organisaties hebben behoefte aan data science, selfservice BI, embedded BI, edge analytics en klantgedreven BI. Vaak is het dan ook tijd voor een nieuwe, toekomstbestendige data-architectuur. Dit tweedaagse seminar geeft antwoo...
De DAMA DMBoK2 beschrijft 11 disciplines van Data Management, waarbij Data Governance centraal staat. De Certified Data Management Professional (CDMP) certificatie biedt een traject voor het inleidende niveau (Associate) tot en met hogere niveaus van...
3 april 2025 (halve dag)Praktische workshop met Alec Sharp [Halve dag] Deze workshop door Alec Sharp introduceert conceptmodellering vanuit een non-technisch perspectief. Alec geeft tips en richtlijnen voor de analist, en verkent datamodellering op c...
10, 11 en 14 april 2025Praktische driedaagse workshop met internationaal gerenommeerde spreker Alec Sharp over herkennen, beschrijven en ontwerpen van business processen. De workshop wordt ondersteund met praktijkvoorbeelden en duidelijke, herbruikba...
15 april 2025 Praktische workshop Datavisualisatie - Dashboards en Data Storytelling. Hoe gaat u van data naar inzicht? En hoe gaat u om met grote hoeveelheden data, de noodzaak van storytelling en data science? Lex Pierik behandelt de stromingen in ...
Deel dit bericht