Databricks heeft tijdens de Spark + AI Summit in San Francisco aangekondigd dat het de code achter Databricks Delta als open source aanbiedt. Delta is een op Apache Spark gebaseerd product dat is ontworpen om data net en schoon te houden terwijl het vanuit bronnen naar een cloudgebaseerde analyseomgeving stroomt. Delta Lake, zoals het nieuwe aanbod wordt genoemd, zal vrij beschikbaar zijn onder een Apache 2.0-licentie.
Databricks heeft Delta geïntroduceerd in 2017 om orde te scheppen in de datamanagementkwesties van haar cloudklanten. Databricks Delta is aanvankelijk gepositioneerd als hybride oplossing die elementen van data lakes, MPP-stijl datawarehouses en streaming analytics combineerde als een managed data oplossing.
De cloudservice die eerder gekoppeld was aan Databricks Unified Analytics Platform, wordt een open source softwareproduct/project dat iedereen kan uitvoeren, zelfs organisaties die moeite hebben om grote gegevenssets te beheren die zijn opgeslagen in on-premise of cloudgebaseerde Hadoop en Spark-clusters.
Meer informatie: Delta Lake
14 en 15 mei 2025 Organisaties hebben behoefte aan data science, selfservice BI, embedded BI, edge analytics en klantgedreven BI. Vaak is het dan ook tijd voor een nieuwe, toekomstbestendige data-architectuur. Dit tweedaagse seminar geeft antwoord op...
19 t/m 21 mei 2025Praktische driedaagse workshop met internationaal gerenommeerde trainer Lawrence Corr over het modelleren Datawarehouse / BI systemen op basis van dimensioneel modelleren. De workshop wordt ondersteund met vele oefeningen en praktij...
20 en 21 mei 2025 Deze 2-daagse cursus is ontworpen om dataprofessionals te voorzien van de kennis en praktische vaardigheden die nodig zijn om Knowledge Graphs en Large Language Models (LLM's) te integreren in hun workflows voor datamodelleri...
22 mei 2025 Workshop met BPM-specialist Christian Gijsels over AI-Gedreven Business Analyse met ChatGPT. Kunstmatige Intelligentie, ongetwijfeld een van de meest baanbrekende technologieën tot nu toe, opent nieuwe deuren voor analisten met innovatie...
17 t/m 19 november 2025 De DAMA DMBoK2 beschrijft 11 disciplines van Data Management, waarbij Data Governance centraal staat. De Certified Data Management Professional (CDMP) certificatie biedt een traject voor het inleidende niveau (Associate) tot...
Alleen als In-house beschikbaar Het Logical Data Warehouse, een door Gartner geïntroduceerde architectuur, is gebaseerd op een ontkoppeling van rapportage en analyse enerzijds en gegevensbronnen anderzijds. Een flexibelere architectuur waarbij snell...
Deel dit bericht