Blog
Wat doet een Data Scientist?
De Data Scientist voorspelt klantgedrag met behulp van de data die een financiële dienstverlener voorhanden heeft. Of beter gezegd: hij programmeert algoritmen om dit te doen, met behulp van Machine Learning. In deze blog gaan we verder in op de werkzaamheden van de Data Scientist.

Wat doet een Data Scientist?
De Data Scientist bouwt datamodellen die voorspellen hoe klanten, klantgroepen en markten zich gaan gedragen. Om deze voorspelling te kunnen doen doorloopt hij een aantal stappen:
- Probleem vaststellen;
- Selecteren relevante data;
- Incorrecte datawaarden corrigeren;
- Data transformeren;
- Datamining;
- Datamodel maken;
- Data visualiseren.
Probleem vaststellen
Een collega uit de Business klopt bij de afdeling Data Science aan met een vraag. De Data Scientist doet een uitgebreide uitvraag. Om te voorkomen dat er een ander probleem wordt opgelost dan is aangedragen.
Selecteren relevante data
Financiële dienstverleners verzamelen heel veel data. De Data Scientist is wat dat betreft een kind in een snoepwinkel. Maar niet alle data is relevant om het voorgelegde probleem op te lossen. En dus maakt hij een selectie.
Incorrecte datawaarden corrigeren
Data is heden ten dage nog voor een groot gedeelte mensenwerk. Kortom: ontbrekende waarden of incorrecte waarden zijn er in iedere databron. De Data Scientist trekt de datakwaliteit gelijk.
Data transformeren
Eenheden zijn niet in alle bronnen op dezelfde wijze vastgelegd. De betekenis is gelijk voor een mens van vlees en bloed, maar een machine weet dit niet. Bijvoorbeeld: in bron 1 is Jan 180 centimeter, in bron 2 is hij 1 meter 80. De Data Scientist uniformeert de gebruikte eenheden.
Datamining
De data is nu klaar om geanalyseerd te worden. De Data Scientist doet dit aan de hand van algoritmen met behulp van machine learning. Volledig automatisch dus.
Datamodel maken
Alle data is geanalyseerd. De Data Scientist kan nu een model maken die geïmplementeerd kan worden in dagelijkse business.
Data visualiseren
Een dashboard maakt data inzichtelijk en begrijpelijk voor iedereen die geen dataprofessional is. Visualisatie is essentieel om het eindresultaat te presenteren aan het management.
Wat is het verschil tussen Data Scientist en Data Analist?
In de praktijk worden de functies Data Scientist en Data Analist veelal door elkaar gebruikt. Maar er zijn wel degelijk verschillen. Een Data Scientist is vooral bezig met voorspellingen. Bijvoorbeeld over het toekomstige gedrag van een bepaald type klant. Een Data Analist houdt zich bezig met het inzichtelijk maken van huidig klantgedrag. Maar het grootste verschil is dat de Data Scientist zijn analyse maakt met behulp van Machine Learning. Vaak is de hoeveelheid data groter. Big data dus.
Wat is de rol van datamodellen?
Een dataset moet groot genoeg zijn om gedegen conclusies te kunnen trekken. Data Scientists gebruiken datasets die zo groot zijn dat deze conclusies alleen tot stand kunnen komen met behulp van een gedegen geautomatiseerd datamodel. Een Data Scientist bouwt zelf datamodellen. Eén van de voornaamste verschillen met het werk van Data Engineers, Data Analisten en Datamodel Analisten hierbij is dat de Scientist zoekt naar nieuwe datarelaties die eerder nog niet gelegd zijn. De Data Scientist is de innovator van het datagedreven werken. Out-of-the-box denken is daarom meer van belang dan bij vergelijkbare rollen binnen de Business IT.
Wat heeft een Data Scientist op zijn CV staan?
Het merendeel van de Data Scientists heeft een WO-opleiding afgerond, meestal in een IT-gerelateerde studie. Een Master in Computer Science of Artificial Intelligence is een hele geschikte vooropleiding om als Data Scientist aan de slag te gaan.
Data Science is een jong vakgebied (Data Scientists zijn dus niet zo grijs als onze avatar doet vermoeden). Ondanks het gewicht van de functie is Data Scientist heel vaak de eerste baan die afgestudeerden van met name de eerdergenoemde vooropleidingen.
Gerelateerde vacatures
Ben je op zoek naar een nieuwe uitdaging? Onderstaande vacatures zijn mogelijk interessant voor jou!
Procesmanager CDD
Customer Due Dilligence (CDD) is één van de meest besproken processen in de huidige bankwereld. Banken krijgen stevige deadlines opgelegd vanuit De Nederlandsche Bank (DNB) en doen er alles aan om ze te behalen.

Product Owner
De Product Owner is een onmisbare schakel in het Agile werkproces. Je bent de man of vrouw die de klant altijd centraal zet en jij zorgt ervoor dat digitale processen perfect aansluiten bij de klant.

Wij werken onder andere voor...
Even kennismaken?
Kom gerust bij ons langs voor een kopje koffie of thee. We zijn reuze nieuwsgierig naar jouw verhaal!
