Aan het Johann Bernoulli Instituut van de Rijksuniversiteit Groningen (RUG) heeft Promovendus Danilo Barbosa Coimbra een algoritme ontwikkeld dat multidimensionale projecties maakt van grote gegevensbestanden. Analyse van Big Data zou met het algoritme sneller en nauwkeuriger zijn dan met andere programma’s. Ook heeft Coimbra het algoritme gebruikt om een programma te maken dat voetballiefhebbers helpt hoogtepunten uit wedstrijdvideo's te halen. Coimbra promoveert op 18 maart 2016 aan de RUG bij Alexandru Telea.
Volgens Coimbra bestaan grote gegevensbestanden doorgaans uit een groot aantal items, met voor elk daarvan een groot aantal variabelen of dimensies. Hi geeft als voorbeeld alle Nederlandse gemeenten die informatie produceren over een groot aantal zaken als het gemiddelde inkomen, lokale belastingtarieven enzovoort. Het is eenvoudig om van alle gemeenten bijvoorbeeld de hoogte van de hondenbelasting te vergelijken, maar veel moeilijker om in alle gegevens tegelijk te zoeken naar onverwachte uitkomsten.
"Het algoritme berekent het verschil tussen alle items in de dataset over alle dimensies. Vervolgens wordt het resultaat in een puntenwolk gezet, waarbij items die op elkaar lijken dichter bij elkaar staan." Via deze ‘projectie' is het mogelijk patronen in de gegevens te ontdekken. "De volgende stap is uit te zoeken welke dimensie dit veroorzaakt".
Visualisatie
Het door Coimbra ontwikkelde algoritme kan dat dit veel sneller dan bestaande methoden en bovendien levert het een projectie op met veel minder fouten. Die projecties kunnen twee- of driedimensionaal zijn. Een 3D-projectie is lastiger te interpreteren, maar de promovendus heeft hiervoor ook hulpmiddelen ontwikkeld. Het algoritme kan allerlei verschillende gegevens verwerken. De groep van Coimbra's promotor prof. Alex Telea, Wetenschappelijke Visualisatie en Computergrafiek, kan het gebruiken om via foto's te onderzoeken of verdachte plekjes op de huid kwaadaardig zijn.
WK voetbal
De uit Brazilië afkomstige Coimbra heeft zijn algoritme ook gebruikt voor een meer ontspannende toepassing. Hij maakte een programma dat video's van het laatste WK voetbal in Brazilië 2014 kan analyseren. "Het gebruikt informatie zoals het geluid van het publiek, het commentaar en gebeurtenissen zoals op welk moment in de wedstrijd goals of gele kaarten vielen". Aan de hand hiervan berekent het programma voor elke sectie van tien seconden hoe belangrijk deze is. "Alle secties komen als plaatje op het scherm, waarbij de grootte en de kleurintensiteit aangeven hoe belangrijk ze zijn. En er zijn icoontjes om bijvoorbeeld goals aan te geven.”
Op deze manier kunnen voetballiefhebbers snel de hoogtepunten uit een wedstrijd halen en die secties afspelen door op de bijbehorende plaatjes te klikken. "Maar je kunt ook wedstrijden met elkaar vergelijken of zien hoe verschillende commentatoren de wedstrijd beoordelen". Want een verslaggever zal enthousiaster reageren wanneer zijn eigen land scoort. Het programma is helaas nog niet beschikbaar voor voetballiefhebbers, zegt Telea. "Maar het is klaar voor gebruik, als zich een geïnteresseerde partij meldt".
Het promotieonderzoek van Coimbra vond plaats aan de universiteit van São Paulo en de RUG, binnen een ‘double degree' programma. Zijn proefschrift is getiteld Multidimensional projections for the visual exploration of multimedia data.
14 en 15 mei 2025 Organisaties hebben behoefte aan data science, selfservice BI, embedded BI, edge analytics en klantgedreven BI. Vaak is het dan ook tijd voor een nieuwe, toekomstbestendige data-architectuur. Dit tweedaagse seminar geeft antwoord op...
19 t/m 21 mei 2025Praktische driedaagse workshop met internationaal gerenommeerde trainer Lawrence Corr over het modelleren Datawarehouse / BI systemen op basis van dimensioneel modelleren. De workshop wordt ondersteund met vele oefeningen en praktij...
20 en 21 mei 2025 Deze 2-daagse cursus is ontworpen om dataprofessionals te voorzien van de kennis en praktische vaardigheden die nodig zijn om Knowledge Graphs en Large Language Models (LLM's) te integreren in hun workflows voor datamodelleri...
22 mei 2025 Workshop met BPM-specialist Christian Gijsels over AI-Gedreven Business Analyse met ChatGPT. Kunstmatige Intelligentie, ongetwijfeld een van de meest baanbrekende technologieën tot nu toe, opent nieuwe deuren voor analisten met innovatie...
17 t/m 19 november 2025 De DAMA DMBoK2 beschrijft 11 disciplines van Data Management, waarbij Data Governance centraal staat. De Certified Data Management Professional (CDMP) certificatie biedt een traject voor het inleidende niveau (Associate) tot...
Alleen als In-house beschikbaar Het Logical Data Warehouse, een door Gartner geïntroduceerde architectuur, is gebaseerd op een ontkoppeling van rapportage en analyse enerzijds en gegevensbronnen anderzijds. Een flexibelere architectuur waarbij snell...
Deel dit bericht