De onderzoeksjournalisten van het International Consortium of Investigative Journalists (ICIJ) hebben Talend Data Fabric ingezet voor het Paradise Papers-onderzoek. De onderzoeksjournalisten gebruikten de integratie-oplossing van Talend om 13,4 miljoen versleutelde documenten te analyseren. Deze documenten werden gelekt vanuit twee offshore belastingparadijzen en 19 rechtsgebieden die politici en grote multinationals helpen om transacties en vermogens uit het zicht van de fiscus te houden.
Het ICIJ zet de open source technologie van Talend in om zijn grafische database Neo4j te verrijken met meer dan 1,4 Terabyte aan ongestructureerde data. Deze database gebruikt het visualisatieplatform Linkurious voor het structureren en opvragen van informatie. De Paradise Papers-data bestaan uit e-mailberichten en Excel-, CSV- en PDF-bestanden met tekst en afbeeldingen. Het ICIJ gebruikt daarnaast andere open source-tools om ondersteuning te bieden voor zijn ‘Knowledge Center’ en om alle informatie doorzoekbaar te maken voor journalisten. De 13,4 miljoen onthullende documenten werden verkregen door de Duitse krant Süddeutsche Zeitung. Het ICIJ werkte ongeveer een jaar samen met honderden journalisten en mediapartners om de gelekte informatie te openbaren.
CTO Pierre Romera bij ICIJ kiest Talend voor het opschonen, transformeren en integreren van alle data. “Talend biedt ons onmisbare technologie om een robuuste database op te bouwen. Het gebruik van open source draagt bij aan de beveiliging en de betrouwbaarheid van data, terwijl ons netwerk van onderzoeksjournalisten bergen aan bestanden analyseert. Daarnaast stellen open source-oplossingen ons in staat om te profiteren van de laatste innovaties op het gebied van dataverwerking, -extractie en -visualisatie. Ook de cloud vervult een sleutelrol in het onderzoek. We doen een beroep op de kracht van Amazon Web Services (AWS) om alle data te verwerken en voor een brede groep gebruikers toegankelijk te maken. Cloud-technologie biedt ons on demand schaalbaarheid, zodat we de workload eenvoudig kunnen beheren.”
“Sinds het ICIJ in 2016 gelekte informatie onthulde met de Panama Papers, iets waarvoor het de Pulitzer Prize won, is gebleken hoeveel impact data op onze samenleving kan hebben”, voegt Ciaran Dynes, Senior Vice President Products bij Talend, toe. “Het doet ons een genoegen om ondersteuning te bieden voor diepgaande onderzoeksjournalistiek en mensen die waardevolle inzichten uit data willen putten.”
Bekijk deze video voor meer informatie over de data achter de Paradise Papers.
14 en 15 mei 2025 Organisaties hebben behoefte aan data science, selfservice BI, embedded BI, edge analytics en klantgedreven BI. Vaak is het dan ook tijd voor een nieuwe, toekomstbestendige data-architectuur. Dit tweedaagse seminar geeft antwoord op...
19 t/m 21 mei 2025Praktische driedaagse workshop met internationaal gerenommeerde trainer Lawrence Corr over het modelleren Datawarehouse / BI systemen op basis van dimensioneel modelleren. De workshop wordt ondersteund met vele oefeningen en praktij...
20 en 21 mei 2025 Deze 2-daagse cursus is ontworpen om dataprofessionals te voorzien van de kennis en praktische vaardigheden die nodig zijn om Knowledge Graphs en Large Language Models (LLM's) te integreren in hun workflows voor datamodelleri...
22 mei 2025 Workshop met BPM-specialist Christian Gijsels over AI-Gedreven Business Analyse met ChatGPT. Kunstmatige Intelligentie, ongetwijfeld een van de meest baanbrekende technologieën tot nu toe, opent nieuwe deuren voor analisten met innovatie...
17 t/m 19 november 2025 De DAMA DMBoK2 beschrijft 11 disciplines van Data Management, waarbij Data Governance centraal staat. De Certified Data Management Professional (CDMP) certificatie biedt een traject voor het inleidende niveau (Associate) tot...
Alleen als In-house beschikbaar Het Logical Data Warehouse, een door Gartner geïntroduceerde architectuur, is gebaseerd op een ontkoppeling van rapportage en analyse enerzijds en gegevensbronnen anderzijds. Een flexibelere architectuur waarbij snell...
Deel dit bericht