In de afgelopen twee jaar is zo’n negentig procent van alle wereldwijde opgeslagen data gegenereerd. Met al die data is iets te doen. Als je als bedrijf bijvoorbeeld weet waar, hoe en hoe vaak klanten een app gebruiken, kun je de app optimaliseren en beter inspelen op de behoefte. Deze big data-trend heeft geleid tot een nieuw beroep dat volgens velen enorme kansen biedt voor de komende periode: de data-scientist.
Net als bij elk ander nieuw en trendy beroep is het bij een data-scientist goed om op te passen als iemand zich zo noemt. Veel ontwikkelaars noemden zich in het verleden al snel architect, terwijl ze dat niet waren. Daarom is een business-analist ook niet meteen een data-scientist.
Wat is een data-scientist dan wel? Om te beginnen weet hij (of zij) veel van moderne technologieën . Je moet als data-scientist relevante data kunnen vinden, extraheren, transporteren,bewerken en visualiseren. Of in ieder geval begrijpen hoe dat moet en wat de (on)mogelijkheden zijn. Dat betekent dus dat je kennis moet hebben van bijvoorbeeld NoSQL, Hadoop, Pig, Hyves, Spark en het hele ecosysteem er omheen. Maar ook van bijvoorbeeld “R”. R is een programmeertaal en een omgeving voor statistische analyse en grafische presentatie van gegevens. Het is de open source-versie van S-plus, dat door Bell Labs werd ontwikkeld. Je kunt R gratis downloaden en gebruiken voor datamanipulatie, -calculatie en grafische weergave.
In de tweede plaats kan een data-scientist de data die hij heeft verzameld zo vertalen dat er waarde uit te halen is voor de organisatie. De belofte van big data – waar de data-scientist zijn functie aan heeft te danken – is immers dat je uit grote hoeveelheden data waardevolle verbanden destilleert waarmee je de business verder helpt. Tot slot mag je van een data-scientist ook verwachten dat hij op basis van deze inzichten concrete ideeën ontwikkelt voor de organisatie.
Het is duidelijk dat alleen technische kennis niet voldoende is voor een data-scientist. Je zult ook moeten beschikken over domeinkennis en veel creativiteit, nieuwsgierigheid en inventiviteit. Of zoals Steve Jobs zei tijdens zijn inspirerende begintoespraak op Stanford University in 2005 “Stay Hungry. Stay Foolish”.
Daarnaast moeten organisaties ervoor zorgen dat een data-scientist ook voldoende mandaat binnen de organisatie heeft om zaken voor elkaar te krijgen. Is dat niet het geval, dan blijven initiatieven hangen en profiteren organisaties niet optimaal van hun big data. Geef een data-scientist dus de ruimte om iets te doen. Dan kan hij of zij echt waarde creëren uit data.
14 en 15 mei 2018Een verhelderend seminar waarin kritisch en onafhankelijk de populaire technologieën voor het opslaan en bewerken big data onder de loep worden genomen door datawarehouse- en databasespecialist pur sang Rick van der Lans. A...
28 en 29 mei 2018Praktische tweedaagse workshop met internationaal gerenommeerde spreker Alec Sharp over het modelleren met Entity-Relationship vanuit business perspectief. De workshop wordt ondersteund met praktijkvoorbeelden en duidelijke...
29 en 30 mei 2018 Vergaar nieuwe databronnen en benut analytics en machine learning om de concurrentie een stap voor te blijven. Er wordt gekeken hoe machine learning en advanced analytics technieken zoals tekst-analyse, sentiment analyse, gra...
30 en 31 mei 2018 Praktische tweedaagse workshop met internationaal gerenommeerde spreker Alec Sharp over herkennen, beschrijven en ontwerpen van business processen. De workshop wordt ondersteund met praktijkvoorbeelden en duidelijke, herbruikba...
5 en 6 juni 2018 Correcte informatie die in de juiste vorm en op het gewenste moment beschikbaar is lijkt een vanzelfsprekendheid. Dit doel kan alleen worden bereikt met een consequent beleid, dat doordacht alle fases van de levenscyclus va...
11 t/m 13 juni 2018Driedaagse workshop over requirements management door James Archer. Opstellen, testen en ondubbelzinnig vastleggen van requirements. Unieke driedaagse workshop over requirements management op basis van de Volere methodiek door Jame...
11 en 12 juni 2018 De wereld van business intelligence en datawarehousing hanteert een unieke terminologie en eigen verzameling technologieën, ontwerptechnieken en producten. Voor nieuwkomers kan dit overweldigend overkomen. Want wat beteke...
30 en 31 oktober 2018 Het Logical Data Warehouse, een door Gartner geïntroduceerde architectuur, is gebaseerd op een ontkoppeling van rapportage en analyse enerzijds en gegevensbronnen anderzijds. Een flexibelere architectuur waar...
Deel dit bericht