Onlangs werd in Brussel de Euroclear Text Mining Hackathon gehouden. Tijdens dit door European Data Innovation Hub georganiseerde evenement destilleren deelnemers met text mining-technologie specifieke financiële informatie uit zevenduizend juridische documenten. Na twee dagen van text-mining kwam het team van Teradata als winnaar uit de bus.
De European Data Innovation Hub is een Belgische organisatie die dataprofessionals in heel België ondersteunt met onder andere netwerkactiviteiten, evenementen, trainingen en een e-learning platform. Een van de initiatieven is het organiseren van text-mining hackathons, die als doel hebben tekstanalyse naar een volgend niveau te brengen. Dit moet bijdragen aan het ontwikkelen van tekstgebaseerde softwareoplossingen, die door middel van intelligente analyse helpen om operationele werkzaamheden te vergemakkelijken en organisaties efficiënter te maken.
Flinke concurrentie
De concurrentie tijdens het event was hevig, met grote namen onder de deelnemers, zoals IBM Watson, Anatella/Timi, Teradata en Hadoop Scala. Zij gingen met elkaar de strijd aan, maar ook met diverse teams van jonge python-programmeurs. Het winnende team van Teradata was bijzonder gelukkig met de overwinning tussen deze getalenteerde experts en hun indrukwekkende technologische middelen.
Slimme mix
Om hun overwinning veilig te stellen gebruikten de teamleden van Teradata een mix van machine learning-algoritmes, bestaand uit robuuste feature extraction en engineering-technieken, samen met een uitgebreide set van op regular expressions gebaseerde regels. Op het technologische vlak gebruikte het team vanaf het begin het Aster data science platform, waarmee de winnende resultaten in een recordtijd werden opgeleverd. Het Aster-platform staat bekend om de hoge prestaties, en dit bleek een belangrijke de reden te zijn voor het succes van het team van Teradata dat zowel in de training- als de laatste testfases veel eerder dan de andere teams de eindstreep wist te halen.
Aster
Het winnende team bleef gedurende de hackathon Aster gebruiken om de koppositie vast te houden. Gedurende een paar uur in de vroege ochtend moest die eerste plek even afgestaan worden aan het ‘machtige Python’-team, dat toen een onverwachte uitbarsting van creativiteit had. Maar nadat de nummer-1 positie werd terugveroverd door het Teradata-team, hield het deze vast tot de uiteindelijke overwinning.
Meer informatie: European Data Innovation Hub
15 oktober 2024 Workshop met BPM-specialist Christian Gijsels over AI-Gedreven Business Analyse met ChatGPT. Kunstmatige Intelligentie, ongetwijfeld een van de meest baanbrekende technologieën tot nu toe, opent nieuwe deuren voor analisten met i...
7 november (online seminar op 1 middag)Praktische tutorial met Alec Sharp Alec Sharp illustreert de vele manieren waarop conceptmodellen (conceptuele datamodellen) procesverandering en business analyse ondersteunen. En hij behandelt wat elke data-pr...
11 t/m 13 november 2024Praktische driedaagse workshop met internationaal gerenommeerde trainer Lawrence Corr over het modelleren Datawarehouse / BI systemen op basis van dimensioneel modelleren. De workshop wordt ondersteund met vele oefeningen en pr...
18 t/m 20 november 2024Praktische workshop met internationaal gerenommeerde spreker Alec Sharp over het modelleren met Entity-Relationship vanuit business perspectief. De workshop wordt ondersteund met praktijkvoorbeelden en duidelijke, herbruikbare ...
21 november 2024 Praktische en interactieve workshop met Nigel Turner Data-gedreven worden lukt niet door alleen nieuwe technologie en tools aan te schaffen. Het vereist een transformatie van bestaande business modellen, met cultuurverandering, een h...
26 en 27 november 2024 Organisaties hebben behoefte aan data science, selfservice BI, embedded BI, edge analytics en klantgedreven BI. Vaak is het dan ook tijd voor een nieuwe, toekomstbestendige data-architectuur. Dit tweedaagse seminar geeft antwoo...
28 november 2024Workshop met BPM-specialist Christian Gijsels over business analyse, modelleren en simuleren met de nieuwste release van Sparx Systems' Enterprise Architect, versie 16.Intensieve cursus waarin de belangrijkste basisfunctionaliteiten v...
De DAMA DMBoK2 beschrijft 11 disciplines van Data Management, waarbij Data Governance centraal staat. De Certified Data Management Professional (CDMP) certificatie biedt een traject voor het inleidende niveau (Associate) tot en met hogere niveaus van...
Deel dit bericht