Aan het Johann Bernoulli Instituut van de Rijksuniversiteit Groningen (RUG) heeft Promovendus Danilo Barbosa Coimbra een algoritme ontwikkeld dat multidimensionale projecties maakt van grote gegevensbestanden. Analyse van Big Data zou met het algoritme sneller en nauwkeuriger zijn dan met andere programma’s. Ook heeft Coimbra het algoritme gebruikt om een programma te maken dat voetballiefhebbers helpt hoogtepunten uit wedstrijdvideo's te halen. Coimbra promoveert op 18 maart 2016 aan de RUG bij Alexandru Telea.
Volgens Coimbra bestaan grote gegevensbestanden doorgaans uit een groot aantal items, met voor elk daarvan een groot aantal variabelen of dimensies. Hi geeft als voorbeeld alle Nederlandse gemeenten die informatie produceren over een groot aantal zaken als het gemiddelde inkomen, lokale belastingtarieven enzovoort. Het is eenvoudig om van alle gemeenten bijvoorbeeld de hoogte van de hondenbelasting te vergelijken, maar veel moeilijker om in alle gegevens tegelijk te zoeken naar onverwachte uitkomsten.
"Het algoritme berekent het verschil tussen alle items in de dataset over alle dimensies. Vervolgens wordt het resultaat in een puntenwolk gezet, waarbij items die op elkaar lijken dichter bij elkaar staan." Via deze ‘projectie' is het mogelijk patronen in de gegevens te ontdekken. "De volgende stap is uit te zoeken welke dimensie dit veroorzaakt".
Visualisatie
Het door Coimbra ontwikkelde algoritme kan dat dit veel sneller dan bestaande methoden en bovendien levert het een projectie op met veel minder fouten. Die projecties kunnen twee- of driedimensionaal zijn. Een 3D-projectie is lastiger te interpreteren, maar de promovendus heeft hiervoor ook hulpmiddelen ontwikkeld. Het algoritme kan allerlei verschillende gegevens verwerken. De groep van Coimbra's promotor prof. Alex Telea, Wetenschappelijke Visualisatie en Computergrafiek, kan het gebruiken om via foto's te onderzoeken of verdachte plekjes op de huid kwaadaardig zijn.
WK voetbal
De uit Brazilië afkomstige Coimbra heeft zijn algoritme ook gebruikt voor een meer ontspannende toepassing. Hij maakte een programma dat video's van het laatste WK voetbal in Brazilië 2014 kan analyseren. "Het gebruikt informatie zoals het geluid van het publiek, het commentaar en gebeurtenissen zoals op welk moment in de wedstrijd goals of gele kaarten vielen". Aan de hand hiervan berekent het programma voor elke sectie van tien seconden hoe belangrijk deze is. "Alle secties komen als plaatje op het scherm, waarbij de grootte en de kleurintensiteit aangeven hoe belangrijk ze zijn. En er zijn icoontjes om bijvoorbeeld goals aan te geven.”
Op deze manier kunnen voetballiefhebbers snel de hoogtepunten uit een wedstrijd halen en die secties afspelen door op de bijbehorende plaatjes te klikken. "Maar je kunt ook wedstrijden met elkaar vergelijken of zien hoe verschillende commentatoren de wedstrijd beoordelen". Want een verslaggever zal enthousiaster reageren wanneer zijn eigen land scoort. Het programma is helaas nog niet beschikbaar voor voetballiefhebbers, zegt Telea. "Maar het is klaar voor gebruik, als zich een geïnteresseerde partij meldt".
Het promotieonderzoek van Coimbra vond plaats aan de universiteit van São Paulo en de RUG, binnen een ‘double degree' programma. Zijn proefschrift is getiteld Multidimensional projections for the visual exploration of multimedia data.
7 november (online seminar op 1 middag)Praktische tutorial met Alec Sharp Alec Sharp illustreert de vele manieren waarop conceptmodellen (conceptuele datamodellen) procesverandering en business analyse ondersteunen. En hij behandelt wat elke data-pr...
11 t/m 13 november 2024Praktische driedaagse workshop met internationaal gerenommeerde trainer Lawrence Corr over het modelleren Datawarehouse / BI systemen op basis van dimensioneel modelleren. De workshop wordt ondersteund met vele oefeningen en pr...
18 t/m 20 november 2024Praktische workshop met internationaal gerenommeerde spreker Alec Sharp over het modelleren met Entity-Relationship vanuit business perspectief. De workshop wordt ondersteund met praktijkvoorbeelden en duidelijke, herbruikbare ...
26 en 27 november 2024 Organisaties hebben behoefte aan data science, selfservice BI, embedded BI, edge analytics en klantgedreven BI. Vaak is het dan ook tijd voor een nieuwe, toekomstbestendige data-architectuur. Dit tweedaagse seminar geeft antwoo...
De DAMA DMBoK2 beschrijft 11 disciplines van Data Management, waarbij Data Governance centraal staat. De Certified Data Management Professional (CDMP) certificatie biedt een traject voor het inleidende niveau (Associate) tot en met hogere niveaus van...
3 april 2025 (halve dag)Praktische workshop met Alec Sharp [Halve dag] Deze workshop door Alec Sharp introduceert conceptmodellering vanuit een non-technisch perspectief. Alec geeft tips en richtlijnen voor de analist, en verkent datamodellering op c...
10, 11 en 14 april 2025Praktische driedaagse workshop met internationaal gerenommeerde spreker Alec Sharp over herkennen, beschrijven en ontwerpen van business processen. De workshop wordt ondersteund met praktijkvoorbeelden en duidelijke, herbruikba...
15 april 2025 Praktische workshop Datavisualisatie - Dashboards en Data Storytelling. Hoe gaat u van data naar inzicht? En hoe gaat u om met grote hoeveelheden data, de noodzaak van storytelling en data science? Lex Pierik behandelt de stromingen in ...
Deel dit bericht