Databricks kondigt de overeenkomst aan voor de overname van datamanagement-leverancier Tabular. De overname brengt de oorspronkelijke makers van Apache Iceberg en Linux Foundation Delta Lake bij elkaar, twee toonaangevende open source-formats voor data lakehouses. De teams van Databricks en Tabular zullen samen verder werken aan een open standaard voor interoperabiliteit en datacompatibiliteit, zodat organisaties niet meer beperkt worden tot specifieke dataformats.
Delta Lake en Iceberg zijn twee van de meest gebruikte open source lakehouse-formats, maar compatibiliteit wordt een steeds grotere uitdaging. Zo zijn de twee formats niet compatibel met elkaar. Bovendien worden Delta Lake en Iceberg veel gebruikt in oplossingen van derden, waarbij doorgaans voor één van de twee wordt gekozen – of er slechts een deel van het format wordt gebruikt. Dit leidt tot gefragmenteerde en gesilo’de bedrijfsdata, wat het lakehouse juist moet voorkomen.
Om de gewenste interoperabiliteit te bereiken zal Databricks nauw samenwerken met de open source-communities van Delta Lake en Iceberg. Dit is een langdurig project, dat waarschijnlijk meerdere jaren in beslag zal nemen. Als eerste stap introduceerde Databricks vorig jaar Delta Lake UniForm. UniForm-tabellen bieden interoperabiliteit tussen Delta Lake, Iceberg en Hudi en ondersteunen de Iceberg restful catalog interface, zodat bedrijven hun vertrouwde analytics engines en tools kunnen gebruiken voor al hun data. UniForm, dat vandaag algemeen beschikbaar is, stelt bedrijven in staat om compatibiliteit te bereiken. Met de toevoeging van het oorspronkelijke Iceberg-team heeft Databricks nog grotere ambities: de ontwikkeling van een enkele open standaard voor datacompatibiliteit.
De voorgestelde overname zal naar verwachting worden afgerond in het tweede fiscale kwartaal van Databricks.
14 en 15 mei 2025 Organisaties hebben behoefte aan data science, selfservice BI, embedded BI, edge analytics en klantgedreven BI. Vaak is het dan ook tijd voor een nieuwe, toekomstbestendige data-architectuur. Dit tweedaagse seminar geeft antwoord op...
19 t/m 21 mei 2025Praktische driedaagse workshop met internationaal gerenommeerde trainer Lawrence Corr over het modelleren Datawarehouse / BI systemen op basis van dimensioneel modelleren. De workshop wordt ondersteund met vele oefeningen en praktij...
20 en 21 mei 2025 Deze 2-daagse cursus is ontworpen om dataprofessionals te voorzien van de kennis en praktische vaardigheden die nodig zijn om Knowledge Graphs en Large Language Models (LLM's) te integreren in hun workflows voor datamodelleri...
22 mei 2025 Workshop met BPM-specialist Christian Gijsels over AI-Gedreven Business Analyse met ChatGPT. Kunstmatige Intelligentie, ongetwijfeld een van de meest baanbrekende technologieën tot nu toe, opent nieuwe deuren voor analisten met innovatie...
17 t/m 19 november 2025 De DAMA DMBoK2 beschrijft 11 disciplines van Data Management, waarbij Data Governance centraal staat. De Certified Data Management Professional (CDMP) certificatie biedt een traject voor het inleidende niveau (Associate) tot...
Alleen als In-house beschikbaar Het Logical Data Warehouse, een door Gartner geïntroduceerde architectuur, is gebaseerd op een ontkoppeling van rapportage en analyse enerzijds en gegevensbronnen anderzijds. Een flexibelere architectuur waarbij snell...
Deel dit bericht