De onderzoeksjournalisten van het International Consortium of Investigative Journalists (ICIJ) hebben Talend Data Fabric ingezet voor het Paradise Papers-onderzoek. De onderzoeksjournalisten gebruikten de integratie-oplossing van Talend om 13,4 miljoen versleutelde documenten te analyseren. Deze documenten werden gelekt vanuit twee offshore belastingparadijzen en 19 rechtsgebieden die politici en grote multinationals helpen om transacties en vermogens uit het zicht van de fiscus te houden.
Het ICIJ zet de open source technologie van Talend in om zijn grafische database Neo4j te verrijken met meer dan 1,4 Terabyte aan ongestructureerde data. Deze database gebruikt het visualisatieplatform Linkurious voor het structureren en opvragen van informatie. De Paradise Papers-data bestaan uit e-mailberichten en Excel-, CSV- en PDF-bestanden met tekst en afbeeldingen. Het ICIJ gebruikt daarnaast andere open source-tools om ondersteuning te bieden voor zijn ‘Knowledge Center’ en om alle informatie doorzoekbaar te maken voor journalisten. De 13,4 miljoen onthullende documenten werden verkregen door de Duitse krant Süddeutsche Zeitung. Het ICIJ werkte ongeveer een jaar samen met honderden journalisten en mediapartners om de gelekte informatie te openbaren.
CTO Pierre Romera bij ICIJ kiest Talend voor het opschonen, transformeren en integreren van alle data. “Talend biedt ons onmisbare technologie om een robuuste database op te bouwen. Het gebruik van open source draagt bij aan de beveiliging en de betrouwbaarheid van data, terwijl ons netwerk van onderzoeksjournalisten bergen aan bestanden analyseert. Daarnaast stellen open source-oplossingen ons in staat om te profiteren van de laatste innovaties op het gebied van dataverwerking, -extractie en -visualisatie. Ook de cloud vervult een sleutelrol in het onderzoek. We doen een beroep op de kracht van Amazon Web Services (AWS) om alle data te verwerken en voor een brede groep gebruikers toegankelijk te maken. Cloud-technologie biedt ons on demand schaalbaarheid, zodat we de workload eenvoudig kunnen beheren.”
“Sinds het ICIJ in 2016 gelekte informatie onthulde met de Panama Papers, iets waarvoor het de Pulitzer Prize won, is gebleken hoeveel impact data op onze samenleving kan hebben”, voegt Ciaran Dynes, Senior Vice President Products bij Talend, toe. “Het doet ons een genoegen om ondersteuning te bieden voor diepgaande onderzoeksjournalistiek en mensen die waardevolle inzichten uit data willen putten.”
Bekijk deze video voor meer informatie over de data achter de Paradise Papers.
24 en 25 april 2024 Organisaties hebben behoefte aan data science, selfservice BI, embedded BI, edge analytics en klantgedreven BI. Vaak is het dan ook tijd voor een nieuwe, toekomstbestendige data-architectuur. Dit tweedaagse seminar geeft antwoord ...
16 mei 2024 Praktische en interactieve workshop met Nigel Turner Data-gedreven worden lukt niet door alleen nieuwe technologie en tools aan te schaffen. Het vereist een transformatie van bestaande business modellen, met cultuurverandering, een heront...
23 mei 2024 (halve dag online) Praktische en interactieve workshop met Nigel Turner In ons digitale tijdperk willen veel organisaties datagedreven worden en investeren zij fors in nieuwe technologieën om dit mogelijk te maken. Maar deze i...
29 - 31 mei 2024Praktische driedaagse workshop met internationaal gerenommeerde spreker Alec Sharp over herkennen, beschrijven en ontwerpen van business processen. De workshop wordt ondersteund met praktijkvoorbeelden en duidelijke, herbruikbare rich...
3 t/m 5 juni 2024Praktische workshop met internationaal gerenommeerde spreker Alec Sharp over het modelleren met Entity-Relationship vanuit business perspectief. De workshop wordt ondersteund met praktijkvoorbeelden en duidelijke, herbruikbare richtl...
10 t/m 12 juni 2024 Praktische workshop Data Management Fundamentals door Chris Bradley - CDMP-examinatie optioneel De DAMA DMBoK2 beschrijft 11 disciplines van Data Management, waarbij Data Governance centraal staat. De Certified Data Managem...
17 t/m 19 juni 2024Praktische driedaagse workshop met internationaal gerenommeerde trainer Lawrence Corr over het modelleren Datawarehouse / BI systemen op basis van dimensioneel modelleren. De workshop wordt ondersteund met vele oefeningen en prakti...
15 oktober 2024 Workshop met BPM-specialist Christian Gijsels over AI-Gedreven Business Analyse met ChatGPT. Kunstmatige Intelligentie, ongetwijfeld een van de meest baanbrekende technologieën tot nu toe, opent nieuwe deuren voor analisten met i...
Deel dit bericht