De onderzoeksjournalisten van het International Consortium of Investigative Journalists (ICIJ) hebben Talend Data Fabric ingezet voor het Paradise Papers-onderzoek. De onderzoeksjournalisten gebruikten de integratie-oplossing van Talend om 13,4 miljoen versleutelde documenten te analyseren. Deze documenten werden gelekt vanuit twee offshore belastingparadijzen en 19 rechtsgebieden die politici en grote multinationals helpen om transacties en vermogens uit het zicht van de fiscus te houden.
Het ICIJ zet de open source technologie van Talend in om zijn grafische database Neo4j te verrijken met meer dan 1,4 Terabyte aan ongestructureerde data. Deze database gebruikt het visualisatieplatform Linkurious voor het structureren en opvragen van informatie. De Paradise Papers-data bestaan uit e-mailberichten en Excel-, CSV- en PDF-bestanden met tekst en afbeeldingen. Het ICIJ gebruikt daarnaast andere open source-tools om ondersteuning te bieden voor zijn ‘Knowledge Center’ en om alle informatie doorzoekbaar te maken voor journalisten. De 13,4 miljoen onthullende documenten werden verkregen door de Duitse krant Süddeutsche Zeitung. Het ICIJ werkte ongeveer een jaar samen met honderden journalisten en mediapartners om de gelekte informatie te openbaren.
CTO Pierre Romera bij ICIJ kiest Talend voor het opschonen, transformeren en integreren van alle data. “Talend biedt ons onmisbare technologie om een robuuste database op te bouwen. Het gebruik van open source draagt bij aan de beveiliging en de betrouwbaarheid van data, terwijl ons netwerk van onderzoeksjournalisten bergen aan bestanden analyseert. Daarnaast stellen open source-oplossingen ons in staat om te profiteren van de laatste innovaties op het gebied van dataverwerking, -extractie en -visualisatie. Ook de cloud vervult een sleutelrol in het onderzoek. We doen een beroep op de kracht van Amazon Web Services (AWS) om alle data te verwerken en voor een brede groep gebruikers toegankelijk te maken. Cloud-technologie biedt ons on demand schaalbaarheid, zodat we de workload eenvoudig kunnen beheren.”
“Sinds het ICIJ in 2016 gelekte informatie onthulde met de Panama Papers, iets waarvoor het de Pulitzer Prize won, is gebleken hoeveel impact data op onze samenleving kan hebben”, voegt Ciaran Dynes, Senior Vice President Products bij Talend, toe. “Het doet ons een genoegen om ondersteuning te bieden voor diepgaande onderzoeksjournalistiek en mensen die waardevolle inzichten uit data willen putten.”
Bekijk deze video voor meer informatie over de data achter de Paradise Papers.
7 november (online seminar op 1 middag)Praktische tutorial met Alec Sharp Alec Sharp illustreert de vele manieren waarop conceptmodellen (conceptuele datamodellen) procesverandering en business analyse ondersteunen. En hij behandelt wat elke data-pr...
11 t/m 13 november 2024Praktische driedaagse workshop met internationaal gerenommeerde trainer Lawrence Corr over het modelleren Datawarehouse / BI systemen op basis van dimensioneel modelleren. De workshop wordt ondersteund met vele oefeningen en pr...
18 t/m 20 november 2024Praktische workshop met internationaal gerenommeerde spreker Alec Sharp over het modelleren met Entity-Relationship vanuit business perspectief. De workshop wordt ondersteund met praktijkvoorbeelden en duidelijke, herbruikbare ...
26 en 27 november 2024 Organisaties hebben behoefte aan data science, selfservice BI, embedded BI, edge analytics en klantgedreven BI. Vaak is het dan ook tijd voor een nieuwe, toekomstbestendige data-architectuur. Dit tweedaagse seminar geeft antwoo...
De DAMA DMBoK2 beschrijft 11 disciplines van Data Management, waarbij Data Governance centraal staat. De Certified Data Management Professional (CDMP) certificatie biedt een traject voor het inleidende niveau (Associate) tot en met hogere niveaus van...
3 april 2025 (halve dag)Praktische workshop met Alec Sharp [Halve dag] Deze workshop door Alec Sharp introduceert conceptmodellering vanuit een non-technisch perspectief. Alec geeft tips en richtlijnen voor de analist, en verkent datamodellering op c...
10, 11 en 14 april 2025Praktische driedaagse workshop met internationaal gerenommeerde spreker Alec Sharp over herkennen, beschrijven en ontwerpen van business processen. De workshop wordt ondersteund met praktijkvoorbeelden en duidelijke, herbruikba...
15 april 2025 Praktische workshop Datavisualisatie - Dashboards en Data Storytelling. Hoe gaat u van data naar inzicht? En hoe gaat u om met grote hoeveelheden data, de noodzaak van storytelling en data science? Lex Pierik behandelt de stromingen in ...
Deel dit bericht