Onlangs werd in Brussel de Euroclear Text Mining Hackathon gehouden. Tijdens dit door European Data Innovation Hub georganiseerde evenement destilleren deelnemers met text mining-technologie specifieke financiële informatie uit zevenduizend juridische documenten. Na twee dagen van text-mining kwam het team van Teradata als winnaar uit de bus.
De European Data Innovation Hub is een Belgische organisatie die dataprofessionals in heel België ondersteunt met onder andere netwerkactiviteiten, evenementen, trainingen en een e-learning platform. Een van de initiatieven is het organiseren van text-mining hackathons, die als doel hebben tekstanalyse naar een volgend niveau te brengen. Dit moet bijdragen aan het ontwikkelen van tekstgebaseerde softwareoplossingen, die door middel van intelligente analyse helpen om operationele werkzaamheden te vergemakkelijken en organisaties efficiënter te maken.
Flinke concurrentie
De concurrentie tijdens het event was hevig, met grote namen onder de deelnemers, zoals IBM Watson, Anatella/Timi, Teradata en Hadoop Scala. Zij gingen met elkaar de strijd aan, maar ook met diverse teams van jonge python-programmeurs. Het winnende team van Teradata was bijzonder gelukkig met de overwinning tussen deze getalenteerde experts en hun indrukwekkende technologische middelen.
Slimme mix
Om hun overwinning veilig te stellen gebruikten de teamleden van Teradata een mix van machine learning-algoritmes, bestaand uit robuuste feature extraction en engineering-technieken, samen met een uitgebreide set van op regular expressions gebaseerde regels. Op het technologische vlak gebruikte het team vanaf het begin het Aster data science platform, waarmee de winnende resultaten in een recordtijd werden opgeleverd. Het Aster-platform staat bekend om de hoge prestaties, en dit bleek een belangrijke de reden te zijn voor het succes van het team van Teradata dat zowel in de training- als de laatste testfases veel eerder dan de andere teams de eindstreep wist te halen.
Aster
Het winnende team bleef gedurende de hackathon Aster gebruiken om de koppositie vast te houden. Gedurende een paar uur in de vroege ochtend moest die eerste plek even afgestaan worden aan het ‘machtige Python’-team, dat toen een onverwachte uitbarsting van creativiteit had. Maar nadat de nummer-1 positie werd terugveroverd door het Teradata-team, hield het deze vast tot de uiteindelijke overwinning.
Meer informatie: European Data Innovation Hub
7 november (online seminar op 1 middag)Praktische tutorial met Alec Sharp Alec Sharp illustreert de vele manieren waarop conceptmodellen (conceptuele datamodellen) procesverandering en business analyse ondersteunen. En hij behandelt wat elke data-pr...
11 t/m 13 november 2024Praktische driedaagse workshop met internationaal gerenommeerde trainer Lawrence Corr over het modelleren Datawarehouse / BI systemen op basis van dimensioneel modelleren. De workshop wordt ondersteund met vele oefeningen en pr...
18 t/m 20 november 2024Praktische workshop met internationaal gerenommeerde spreker Alec Sharp over het modelleren met Entity-Relationship vanuit business perspectief. De workshop wordt ondersteund met praktijkvoorbeelden en duidelijke, herbruikbare ...
26 en 27 november 2024 Organisaties hebben behoefte aan data science, selfservice BI, embedded BI, edge analytics en klantgedreven BI. Vaak is het dan ook tijd voor een nieuwe, toekomstbestendige data-architectuur. Dit tweedaagse seminar geeft antwoo...
De DAMA DMBoK2 beschrijft 11 disciplines van Data Management, waarbij Data Governance centraal staat. De Certified Data Management Professional (CDMP) certificatie biedt een traject voor het inleidende niveau (Associate) tot en met hogere niveaus van...
3 april 2025 (halve dag)Praktische workshop met Alec Sharp [Halve dag] Deze workshop door Alec Sharp introduceert conceptmodellering vanuit een non-technisch perspectief. Alec geeft tips en richtlijnen voor de analist, en verkent datamodellering op c...
10, 11 en 14 april 2025Praktische driedaagse workshop met internationaal gerenommeerde spreker Alec Sharp over herkennen, beschrijven en ontwerpen van business processen. De workshop wordt ondersteund met praktijkvoorbeelden en duidelijke, herbruikba...
15 april 2025 Praktische workshop Datavisualisatie - Dashboards en Data Storytelling. Hoe gaat u van data naar inzicht? En hoe gaat u om met grote hoeveelheden data, de noodzaak van storytelling en data science? Lex Pierik behandelt de stromingen in ...
Deel dit bericht