Leer Apache Spark te gebruiken op Azure clusters, beheerd door Databricks.
Azure Databricks is een analytics platform gespecialiseerd in zware berekeningen op grote schaal. Dit wordt uitgevoerd door Apache Spark te koppelen aan Azure clusters. Hierdoor is het een schaalbare, veelzijdige en snelle oplossing voor zware dataprocessen. Door het clustermanagement van Databricks is samenwerken op deze projecten ook een fluitje van een cent.
In deze training leert u hoe u een Databricks omgeving opstart, uw data importeert en vervolgens de rekenkracht van Azure Databricks gebruikt voor ETL processen en Data Science projecten. Daarnaast ontdekt u hoe u in Azure Databricks kunt samenwerken en uw kosten beheersen.
Cursusinhoud
- De infrastructuur van Azure Databricks
- Het gebruik van Apache Spark
- Importeren van data uit verschillende bronnen
- Uitvoeren van datamanipulaties in Databricks notebooks
- Cloud Data Science toepassen in Azure Databricks
- Kostenbeheersing en samenwerken in Azure Databricks
Startdatum: 14 oktober 2019
Locatie: Utrecht
Het tarief voor deze training is € 1.170,00 per persoon.
Inschrijven
Op woensdag 25 en donderdag 26 maart 2020 vindt in het Van der Valk Hotel in Utrecht voor de zevende keer de Data Warehousing & Business Intelligence Summit plaats. Dit onafhankelijke congres wordt wederom georganiseerd door Adept Events, en heeft oo...
30 en 31 maart 2020Praktische workshop met internationaal gerenommeerde trainer Keith McCormick over machine learning. De workshop wordt ondersteund met oefeningen en praktijkvoorbeelden.Praktische workshop met Keith McCormick over het toepasse...
30 en 31 maart 2020Praktische workshop met internationaal gerenommeerde trainer Dave Wells over cloud datawarehousing. De workshop wordt ondersteund met oefeningen en praktijkvoorbeelden.Wat zijn de voor- en nadelen van Cloud Datawarehousing en hoe...
7 en 8 april 2020 Het Logical Data Warehouse, een door Gartner geïntroduceerde architectuur, is gebaseerd op een ontkoppeling van rapportage en analyse enerzijds en gegevensbronnen anderzijds. Een flexibelere architectuur waarbij sneller nieuwe ...
9 april 2020 Praktische workshop Datavisualisatie en Data-driven Storytelling. Hoe gaat u van data naar inzicht? En hoe gaat u om met grote hoeveelheden data, de noodzaak van storytelling, data science en de data artist? Lex Pierik behandelt de ...
21 en 22 april 2020 Praktisch tweedaags seminar met internationaal gerenommeerde spreker Mike Ferguson over het opzetten van een Enterprise Data Lake. Het seminar wordt ondersteund met praktijkvoorbeelden en duidelijke, herbruikbare richtlijnen. In d...
12 en 13 mei 2020 Organisaties hebben behoefte aan data science, selfservice BI, embedded BI, edge analytics en klantgedreven BI. Vaak is het dan ook tijd voor een nieuwe, toekomstbestendige data-architectuur. Dit tweedaagse seminar geeft antwoord op...
13 - 15 mei 2020Praktische driedaagse workshop met internationaal gerenommeerde trainer Lawrence Corr over het modelleren Datawarehouse / BI systemen op basis van dimensioneel modelleren. De workshop wordt ondersteund met vele oefeningen en praktijkv...
Deel dit bericht