SAS, aanbieder in analytics, heeft aan de hand van grote hoeveelheden publiek beschikbare data een lijst met de meest paradijselijke plekken voor wonen, werken en leven op aarde samengesteld. Er is door de data scientists gebruikgemaakt van stadsonderzoeken, sociale media, bekende review sites zoals TripAdvisor, geodata en data verkregen van statistische organisaties zoals UNESCO en WTO. De Australische kustplaats West Perth staat als nummer één op de lijst. De resultaten van het Paradise Found project zijn tijdens de sessie Innovate with Analytics op 13 maart gepresenteerd.
De meeste marktonderzoeken maken gebruik van vooraf gedefinieerde criteria. Bij het project ‘Paradise Found’ hebben data scientists met machine learning de belangrijkste criteria afgeleid vanuit de data. Door het grote aantal onderzochte locaties is dit niet alleen een veel breder onderzoek dan bestaande beoordelingen van steden, maar ook veel gedetailleerder door de analyse van individuele kenmerken.
“Paradise Found is geen doorsnee ranglijst van toffe steden. Het is een puur analytisch onderzoek, waarmee we de mogelijkheden van machine learning-technieken willen laten zien. Voor Paradise Found hebben we alle beschikbare gegevens verwerkt en vervolgens machine learning algoritmen laten bepalen welke criteria echt belangrijk zijn. De data spreken voor zich, het is geen vooropgezet model”, stelt Edwin Peters, pre-sales director bij SAS.
Bronmateriaal voor Paradise Found
In totaal analyseerden de data scientists van SAS voor het project ‘Paradise Found’ meer dan 5 miljoen datapunten van 1.124 unieke databronnen. Dit omvatte zowel gestructureerde als ongestructureerde data (bijvoorbeeld in de vorm van teksten van statistiekbureaus). Het bronmateriaal bestond verder uit diverse open databronnen, waaronder stadsonderzoeken, sociale media (onder andere TripAdvisor en Twitter), data van internationale organisaties zoals de Wereldbank, UNESCO, WTOI, Numbeo en de Europese Unie, en geodata-services zoals Google Places en OpenStreetMap.
Breed scala aan innovatieve analytics oplossingen
Het was cruciaal om deze grote hoeveelheid ongestructureerde en gestructureerde data nauwkeurig te verzamelen en te combineren met behulp van SAS Data Management. De gegevens zijn opgeschoond, gestructureerd en verwerkt met behulp van het SAS Platform. Voor de analyse werden SAS Visual Data Mining en Machine Learning en SAS Visual Analytics gebruikt. Hieruit volgden de 69 belangrijkste criteria en werden 8 categorieën geïdentificeerd: ‘Opleiding en carrière’, ‘Familie’, ‘Cultuur’, ‘Natuur’, ‘Veiligheid en infrastructuur’, ‘Kosten van levensonderhoud’, ‘Restaurants en winkels’ en ‘Gezondheid’.
De winnaar is groen, veilig en een culturele hotspot
West Perth verdiende veel punten in de categorieën ‘Restaurants en winkels’, ‘Cultuur’ en ‘Veiligheid en infrastructuur’. De analyse onthulde ook positieve kenmerken die anders waarschijnlijk nooit op de lijst met criteria waren terechtgekomen. Het ging bijvoorbeeld om de prijzen van openbaar vervoer (dat is in Perth gratis) en de hoeveelheid groengebied (vijf tennisbanen per inwoner van Perth). Bovendien woont hier het grootste aantal selfmade miljonairs per inwoner.
Toepassingen van analytics in het bedrijfsleven
“Dit project is een mooi voorbeeld van wat analyse en machine learning kunnen doen: patronen in data vinden vanuit een volkomen objectief perspectief. Natuurlijk is het leuk om te weten waar de meeste paradijselijke plek ter wereld zich bevindt, maar veel belangrijker zijn de toepassingen van analytics in het bedrijfsleven. Hier is het een essentieel hulpmiddel om nieuwe kansen en bedrijfsmodellen te ontdekken. Dit is slechts één voorbeeld, maar als je dit op een herhaalbare wijze kunt uitvoeren dan heb je een daadwerkelijke toepassing van Artificial Intelligence”, zegt Edwin Peters, pre-sales director bij SAS.
7 november (online seminar op 1 middag)Praktische tutorial met Alec Sharp Alec Sharp illustreert de vele manieren waarop conceptmodellen (conceptuele datamodellen) procesverandering en business analyse ondersteunen. En hij behandelt wat elke data-pr...
11 t/m 13 november 2024Praktische driedaagse workshop met internationaal gerenommeerde trainer Lawrence Corr over het modelleren Datawarehouse / BI systemen op basis van dimensioneel modelleren. De workshop wordt ondersteund met vele oefeningen en pr...
18 t/m 20 november 2024Praktische workshop met internationaal gerenommeerde spreker Alec Sharp over het modelleren met Entity-Relationship vanuit business perspectief. De workshop wordt ondersteund met praktijkvoorbeelden en duidelijke, herbruikbare ...
26 en 27 november 2024 Organisaties hebben behoefte aan data science, selfservice BI, embedded BI, edge analytics en klantgedreven BI. Vaak is het dan ook tijd voor een nieuwe, toekomstbestendige data-architectuur. Dit tweedaagse seminar geeft antwoo...
De DAMA DMBoK2 beschrijft 11 disciplines van Data Management, waarbij Data Governance centraal staat. De Certified Data Management Professional (CDMP) certificatie biedt een traject voor het inleidende niveau (Associate) tot en met hogere niveaus van...
3 april 2025 (halve dag)Praktische workshop met Alec Sharp [Halve dag] Deze workshop door Alec Sharp introduceert conceptmodellering vanuit een non-technisch perspectief. Alec geeft tips en richtlijnen voor de analist, en verkent datamodellering op c...
10, 11 en 14 april 2025Praktische driedaagse workshop met internationaal gerenommeerde spreker Alec Sharp over herkennen, beschrijven en ontwerpen van business processen. De workshop wordt ondersteund met praktijkvoorbeelden en duidelijke, herbruikba...
15 april 2025 Praktische workshop Datavisualisatie - Dashboards en Data Storytelling. Hoe gaat u van data naar inzicht? En hoe gaat u om met grote hoeveelheden data, de noodzaak van storytelling en data science? Lex Pierik behandelt de stromingen in ...
Deel dit bericht