19-03-2018

SAS vindt meest paradijselijke plek ter wereld met machine learning

Deel dit bericht

SAS, aanbieder in analytics, heeft aan de hand van grote hoeveelheden publiek beschikbare data een lijst met de meest paradijselijke plekken voor wonen, werken en leven op aarde samengesteld. Er is door de data scientists gebruikgemaakt van stadsonderzoeken, sociale media, bekende review sites zoals TripAdvisor, geodata en data verkregen van statistische organisaties zoals UNESCO en WTO. De Australische kustplaats West Perth staat als nummer één op de lijst. De resultaten van het Paradise Found project zijn tijdens de sessie Innovate with Analytics op 13 maart gepresenteerd.

De meeste marktonderzoeken maken gebruik van vooraf gedefinieerde criteria. Bij het project ‘Paradise Found’ hebben data scientists met machine learning de belangrijkste criteria afgeleid vanuit de data. Door het grote aantal onderzochte locaties is dit niet alleen een veel breder onderzoek dan bestaande beoordelingen van steden, maar ook veel gedetailleerder door de analyse van individuele kenmerken.
“Paradise Found is geen doorsnee ranglijst van toffe steden. Het is een puur analytisch onderzoek, waarmee we de mogelijkheden van machine learning-technieken willen laten zien. Voor Paradise Found hebben we alle beschikbare gegevens verwerkt en vervolgens machine learning algoritmen laten bepalen welke criteria echt belangrijk zijn. De data spreken voor zich, het is geen vooropgezet model”, stelt Edwin Peters, pre-sales director bij SAS.

Bronmateriaal voor Paradise Found
In totaal analyseerden de data scientists van SAS voor het project ‘Paradise Found’ meer dan 5 miljoen datapunten van 1.124 unieke databronnen. Dit omvatte zowel gestructureerde als ongestructureerde data (bijvoorbeeld in de vorm van teksten van statistiekbureaus). Het bronmateriaal bestond verder uit diverse open databronnen, waaronder stadsonderzoeken, sociale media (onder andere TripAdvisor en Twitter), data van internationale organisaties zoals de Wereldbank, UNESCO, WTOI, Numbeo en de Europese Unie, en geodata-services zoals Google Places en OpenStreetMap.

Breed scala aan innovatieve analytics oplossingen
Het was cruciaal om deze grote hoeveelheid ongestructureerde en gestructureerde data nauwkeurig te verzamelen en te combineren met behulp van SAS Data Management. De gegevens zijn opgeschoond, gestructureerd en verwerkt met behulp van het SAS Platform. Voor de analyse werden SAS Visual Data Mining en Machine Learning en SAS Visual Analytics gebruikt. Hieruit volgden de 69 belangrijkste criteria en werden 8 categorieën geïdentificeerd: ‘Opleiding en carrière’, ‘Familie’, ‘Cultuur’, ‘Natuur’, ‘Veiligheid en infrastructuur’, ‘Kosten van levensonderhoud’, ‘Restaurants en winkels’ en ‘Gezondheid’.

De winnaar is groen, veilig en een culturele hotspot
West Perth verdiende veel punten in de categorieën ‘Restaurants en winkels’, ‘Cultuur’ en ‘Veiligheid en infrastructuur’. De analyse onthulde ook positieve kenmerken die anders waarschijnlijk nooit op de lijst met criteria waren terechtgekomen. Het ging bijvoorbeeld om de prijzen van openbaar vervoer (dat is in Perth gratis) en de hoeveelheid groengebied (vijf tennisbanen per inwoner van Perth). Bovendien woont hier het grootste aantal selfmade miljonairs per inwoner.

Toepassingen van analytics in het bedrijfsleven
“Dit project is een mooi voorbeeld van wat analyse en machine learning kunnen doen: patronen in data vinden vanuit een volkomen objectief perspectief. Natuurlijk is het leuk om te weten waar de meeste paradijselijke plek ter wereld zich bevindt, maar veel belangrijker zijn de toepassingen van analytics in het bedrijfsleven. Hier is het een essentieel hulpmiddel om nieuwe kansen en bedrijfsmodellen te ontdekken. Dit is slechts één voorbeeld, maar als je dit op een herhaalbare wijze kunt uitvoeren dan heb je een daadwerkelijke toepassing van Artificial Intelligence”, zegt Edwin Peters, pre-sales director bij SAS.

Partners