Talend introduceert de eerste door Apache Beam ondersteunde selfserviceoplossing voor het prepareren van big data. Apache Beam, een van de meest prominente Apache-projecten, omvat een geïntegreerd programmeermodel om zowel batch- als streaming-data te verwerken en deze over te zetten naar een breed scala aan runtime-platforms.
Talend Data Preparation is een selfserviceoplossing die gebruikers toegang geeft tot grote datasets en hen de mogelijkheid biedt om deze op te schonen en te analyseren. De combinatie van Talend Data Preparation en Apache Beam helpt organisaties om sneller inzicht te krijgen door gebruikers zelf dataprojecten uit te laten voeren. Dit is mogelijk vanaf elke locatie, dankzij het gebruik van de laatste innovaties op het gebied van gegevensverwerking.
Toekomstbestendige oplossing
Volgens Laurent Bride, chief technology officer bij Talend, hebben organisaties behoefte aan betere toegang tot opgeschoonde en bruikbare data, zodat medewerkers real-time inzicht krijgen. “Vanwege het hoge tempo van technologische innovaties maken veel IT-managers zich echter zorgen dat investeringen snel verouderen en toekomstige innovaties tegenwerken. Volgens ons is Apache Beam een uiterst toekomstbestendige oplossing. Het maakt namelijk een einde aan het herschrijven van applicaties wanneer nieuwe technologie wordt geïntroduceerd, systemen in de cloud worden ondergebracht of wanneer integratiemethodieken worden herzien. Het gebruik van Beam voor Talend Data Preparation stelt gebruikers in staat om voorbereidingen eenmalig uit te voeren en vervolgens overal toe te passen.”
Kernelement
Het door Apache Beam ondersteunde Talend Data Preparation werd in januari dit jaar geïntroduceerd als onderdeel van de Winter ’17 release van Talend’s integratieplatform. De oplossing geeft blijk van Talend’s toewijding aan deze geavanceerde technologie voor dataverwerking. Talend werkt sinds 2015 met Google en andere partijen samen aan de ontwikkeling van Apache Beam. De afgelopen twee jaar zijn diverse bijdragen aan de Beam-gemeenschap geleverd. Apache Beam zal een kernelement worden van de integratie-stack van Talend Data Fabric.
Werknemers wapenen met betrouwbare data
Het via selfservice prepareren van data maakt het voor gebruikers binnen diverse afdelingen eenvoudiger om informatie over klanten, leveranciers, producten en partners in hun dagelijkse workflows op te nemen. Hierdoor kunnen ze sneller reageren op de veranderende eisen en marktbehoeften. In een onderzoeksrapport stelt Gartner het volgende: “BI-managers die het prepareren van data op basis van selfservice niet omarmen, maken niet optimaal gebruik van databronnen en lopen het risico achter te blijven op de concurrentie.”1
Toegang tot data lakes
Het omzetten van data naar inzichten vraagt om teamwork. Een succesvolle digitale transformatie vereist een fundamentele verandering in de manier waarop data binnen een organisatie wordt opgevraagd en uitgewisseld. De Winter ’17 release van Talend Data Fabric stelt IT-afdelingen in staat om de business toegang te bieden tot data lakes. Zo kunnen ze gegevens sneller prepareren en opschonen. De preparatiemogelijkheden die Talend biedt stellen organisaties in staat om:
• toegang te krijgen tot iedere databron – of die zich nu in Hadoop, de cloud, of traditionele databases bevindt – en deze te delen met groepen of individuele gebruikers voor een betere samenwerking;
• een vooraf geconfigureerd datawoordenboek te gebruiken, dat automatisch de betekenis van ruwe data uit data lakes herkent. Tevens is het mogelijk om eigen ‘vocabulaire’ aan het woordenboek toe te voegen, zoals productcodes of –namen;
• nieuwe datadefinities te verkrijgen door middel van crowdsourcing op basis van open data en/of de Talend Community.
Meer informatie over de door Apache Beam ondersteunde versie van Talend Data Preparation en de andere mogelijkheden en voordelen van Talend Winter ’17.
Achtergrondinformatie over Apache Beam en de betrokkenheid van Talend bij dit project.
14 en 15 mei 2025 Organisaties hebben behoefte aan data science, selfservice BI, embedded BI, edge analytics en klantgedreven BI. Vaak is het dan ook tijd voor een nieuwe, toekomstbestendige data-architectuur. Dit tweedaagse seminar geeft antwoord op...
19 t/m 21 mei 2025Praktische driedaagse workshop met internationaal gerenommeerde trainer Lawrence Corr over het modelleren Datawarehouse / BI systemen op basis van dimensioneel modelleren. De workshop wordt ondersteund met vele oefeningen en praktij...
20 en 21 mei 2025 Deze 2-daagse cursus is ontworpen om dataprofessionals te voorzien van de kennis en praktische vaardigheden die nodig zijn om Knowledge Graphs en Large Language Models (LLM's) te integreren in hun workflows voor datamodelleri...
22 mei 2025 Workshop met BPM-specialist Christian Gijsels over AI-Gedreven Business Analyse met ChatGPT. Kunstmatige Intelligentie, ongetwijfeld een van de meest baanbrekende technologieën tot nu toe, opent nieuwe deuren voor analisten met innovatie...
17 t/m 19 november 2025 De DAMA DMBoK2 beschrijft 11 disciplines van Data Management, waarbij Data Governance centraal staat. De Certified Data Management Professional (CDMP) certificatie biedt een traject voor het inleidende niveau (Associate) tot...
Alleen als In-house beschikbaar Het Logical Data Warehouse, een door Gartner geïntroduceerde architectuur, is gebaseerd op een ontkoppeling van rapportage en analyse enerzijds en gegevensbronnen anderzijds. Een flexibelere architectuur waarbij snell...
Deel dit bericht