De winnende Olympische tijd van Kjeld Nuis op de 1000 meter was voor de data scientists van SAS geen verrassing. De winnende tijd van Nuis (1:07,95) was te voorspellen op basis van data-analyse. Ook zagen zij aankomen dat Sven Kramer op de 10 kilometer naast het goud zou grijpen.
Om te komen tot deze en meer inzichten in de resultaten van de Nederlands Olympische schaatsers, analyseerden de data scientists 2,4 miljoen wedstrijdresultaten van ruim 64 duizend schaatsers over de afgelopen 11 jaar. Uit de analyse kunnen ook lessen voor de toekomst worden getrokken, want nu is ook duidelijk tot welke leeftijd een wedstrijdschaatser zich nog kan verbeteren en wanneer deze beter zijn ijzers in het vet kan laten.
Speciaal algoritme
Om de tijd van Nijs te kunnen voorspellen, analyseerden de data scientists data van toernooien waarin Nuis de 1.000 en 1.500 meter heeft geschaatst. Voor de analyse gebruikten zij een algoritme dat aan de hand van een 1.500 meter tijd kan voorspellen wat het resultaat gaat worden op de 1.000 meter. Hieruit kwam een tijd van 1:07,7 met een marge van 0,2 seconden. De gereden tijd door Nuis van 1:07,95 bevestigt deze analyse. Ook voor de 1000 meter race van Kai Verbij deden de data scientists een voorspelling: dit was 1:08,4 met een marge van 0,4 seconden. Hij realiseerde een tijd van 1:08,61 waarmee ook deze voorspelling binnen de marge viel.
Puntenplot met regressielijn van tijden 1000 meter (Y-as) en 1500 meter (X-as) Kjeld Nuis.
Kramer weinig kans op goud
Een andere analyse van SAS laat zien dat Sven Kramer met zijn winst op de 5km statistisch gezien weinig kans had op goud op de 10km. Voor deze conclusie hebben de data scientists van SAS alle data van mannelijke schaatsers die in wedstrijdverband de 5km en de 10km hebben geschaatst in een dataset verzameld. Ook op deze 1.852 records is met behulp van machine learning-technieken een analyse uitgevoerd. Daaruit blijkt dat zelfs het Olympisch record op de 5km niet voldoende was voor Kramer om goud te pakken op de 10km. Zijn tijd op de 5km was namelijk 6.09,76 (369,76 seconden). Op basis van het algoritme is zijn voorspelde tijd voor de 10km dan 12:55 wat geen podiumplaats op zou leveren. Uiteindelijk rijdt Kramer 13:01,02.
Kramer geeft op na achtste ronde
“Tijdens de wedstrijd zag je duidelijk dat Kramer het in de achtste ronde van de race opgeeft”, vertelt Jos van Dongen, senior data analist bij SAS. “Kramer zei zelf ook in het interview na de 10km race: ‘als je naar mijn 5km kijkt dan zie je het wel. Ik wist die 10km gaat heel moeilijk worden’. Coach Jac Orie geeft in een reactie daarop aan dat hij het niet had zien aankomen op basis van de tijd op de 5km, maar voor ons was het glashelder toen we naar de data keken. Je had het inderdaad kunnen voorspellen.”
De analyses van SAS laten verder zien dat wereldrecordhouder Ted-Jan Bloemen zelfs iets beter presteert op de 10km dan dat je op basis van zijn tijd op de 5km had kunnen verwachten. Het blijft dus een voorspelling op basis van een statistisch model: de werkelijkheid kan altijd een beetje anders zijn.
Wanneer pieken schaatsers?
Niet alleen werd inzicht verkregen in de prestaties van de schaatsers tijdens deze Olympische Winterspelen, maar ook in wanneer schaatsers hun piek hebben bereikt. De analyse geeft aan dat de gemiddelde wedstrijdschaatser piekt op zijn 27ste. Daarna worden de tijden die worden gereden op de 10km alleen maar slechter. Van Dongen: “Dit geldt echter niet voor schaatsers die de Olympische Spelen halen. Daar zagen we dat Olympische sporters al eerder pieken en ook langer blijven presteren op dat niveau. Dit geldt ook voor Kramer. Zijn tijden op de 10km werden na zijn 25ste soms zelfs nog beter. Een veelbelovende wetenschap voor de spelen van 2022 in Beijing.”
Analyses
Voor de analyses is gebruikgemaakt van data van de site Speedskatingresults.com. Deze data werd geanalyseerd met behulp van SAS Visual Analytics en Visual Statistics, beide onderdeel van het SAS Viya-platform. Dit platform gebruikt de nieuwste technieken op het gebied van artificial intelligence en machine learning.
7 november (online seminar op 1 middag)Praktische tutorial met Alec Sharp Alec Sharp illustreert de vele manieren waarop conceptmodellen (conceptuele datamodellen) procesverandering en business analyse ondersteunen. En hij behandelt wat elke data-pr...
11 t/m 13 november 2024Praktische driedaagse workshop met internationaal gerenommeerde trainer Lawrence Corr over het modelleren Datawarehouse / BI systemen op basis van dimensioneel modelleren. De workshop wordt ondersteund met vele oefeningen en pr...
18 t/m 20 november 2024Praktische workshop met internationaal gerenommeerde spreker Alec Sharp over het modelleren met Entity-Relationship vanuit business perspectief. De workshop wordt ondersteund met praktijkvoorbeelden en duidelijke, herbruikbare ...
26 en 27 november 2024 Organisaties hebben behoefte aan data science, selfservice BI, embedded BI, edge analytics en klantgedreven BI. Vaak is het dan ook tijd voor een nieuwe, toekomstbestendige data-architectuur. Dit tweedaagse seminar geeft antwoo...
De DAMA DMBoK2 beschrijft 11 disciplines van Data Management, waarbij Data Governance centraal staat. De Certified Data Management Professional (CDMP) certificatie biedt een traject voor het inleidende niveau (Associate) tot en met hogere niveaus van...
3 april 2025 (halve dag)Praktische workshop met Alec Sharp [Halve dag] Deze workshop door Alec Sharp introduceert conceptmodellering vanuit een non-technisch perspectief. Alec geeft tips en richtlijnen voor de analist, en verkent datamodellering op c...
10, 11 en 14 april 2025Praktische driedaagse workshop met internationaal gerenommeerde spreker Alec Sharp over herkennen, beschrijven en ontwerpen van business processen. De workshop wordt ondersteund met praktijkvoorbeelden en duidelijke, herbruikba...
15 april 2025 Praktische workshop Datavisualisatie - Dashboards en Data Storytelling. Hoe gaat u van data naar inzicht? En hoe gaat u om met grote hoeveelheden data, de noodzaak van storytelling en data science? Lex Pierik behandelt de stromingen in ...
Deel dit bericht