Databricks heeft Databricks Delta aangekondigd, een uniform dataplatform dat de schaalbaarheid en kostenefficiëntie van een data lake, de query performance van een datawarehouse en de low latency van een streaming systeem biedt. Databricks is leverancier van een Unified Analytics Platform en opgericht door het team dat Apache Spark heeft ontwikkeld.
Databricks Delta is een belangrijk onderdeel van het Databricks Unified Analytics Platform dat in de cloud draait. Het elimineert de architecturale complexiteit en operationele overhead van het onderhouden van drie verschillende systemen: data lakes, datawarehouses en streaming-systemen. Met Delta hebben bedrijven niet langer complexe ETL-processen nodig die over verschillende systemen lopen en een grote latency creëren om data in een snel te bevragen vorm te krijgen.
Databricks Delta biedt de volgende mogelijkheden om enterprise data management te vereenvoudigen:
• Betrouwbaar beheer van continu wijzigende data: het uniforme dataplatform vereenvoudigt pijplijnen door Delta-tabellen als gegevensbron te gebruiken. Deltatabellen bieden transactionele garanties voor meerdere gelijktijdige opererende batch- en streaming-schrijftaken.
• Snelle query's uitvoeren zonder handmatige afstemming: Delta automatiseert prestatiebeheer en maakt handmatig het afstemmen van prestaties overbodig. Zelfoptimaliserende gegevenslay-out zorgt ervoor dat de gegevens die samen worden opgevraagd samen worden opgeslagen. Delta automatiseert het comprimeren van kleine bestanden voor efficiënte leesbewerkingen.
• Biedt kostenefficiëntie en schaalbaarheid voor data lakes: Delta slaat alle gegevens in Amazon S3 op voor kostenefficiëntie en enorme schaal. De gegevens in Delta worden opgeslagen in een open bestandsformaat om de portabiliteit van gegevens te waarborgen en vendor lock-in te voorkomen.
• Integratie met Unified Analytics Platform: Databricks Delta-gegevens zijn toegankelijk vanuit elke Spark-applicatie die op het Databricks-platform draait via de standaard Spark API's. Delta integreert ook in het Databricks Enterprise Security-model.
14 en 15 mei 2025 Organisaties hebben behoefte aan data science, selfservice BI, embedded BI, edge analytics en klantgedreven BI. Vaak is het dan ook tijd voor een nieuwe, toekomstbestendige data-architectuur. Dit tweedaagse seminar geeft antwoord op...
19 t/m 21 mei 2025Praktische driedaagse workshop met internationaal gerenommeerde trainer Lawrence Corr over het modelleren Datawarehouse / BI systemen op basis van dimensioneel modelleren. De workshop wordt ondersteund met vele oefeningen en praktij...
20 en 21 mei 2025 Deze 2-daagse cursus is ontworpen om dataprofessionals te voorzien van de kennis en praktische vaardigheden die nodig zijn om Knowledge Graphs en Large Language Models (LLM's) te integreren in hun workflows voor datamodelleri...
22 mei 2025 Workshop met BPM-specialist Christian Gijsels over AI-Gedreven Business Analyse met ChatGPT. Kunstmatige Intelligentie, ongetwijfeld een van de meest baanbrekende technologieën tot nu toe, opent nieuwe deuren voor analisten met innovatie...
17 t/m 19 november 2025 De DAMA DMBoK2 beschrijft 11 disciplines van Data Management, waarbij Data Governance centraal staat. De Certified Data Management Professional (CDMP) certificatie biedt een traject voor het inleidende niveau (Associate) tot...
Alleen als In-house beschikbaar Het Logical Data Warehouse, een door Gartner geïntroduceerde architectuur, is gebaseerd op een ontkoppeling van rapportage en analyse enerzijds en gegevensbronnen anderzijds. Een flexibelere architectuur waarbij snell...
Deel dit bericht