Wat doet een Data Scientist?

De Data Scientist bouwt datamodellen die voorspellen hoe klanten, klantgroepen en markten zich gaan gedragen. Om deze voorspelling te kunnen doen doorloopt hij een aantal stappen:

  • Probleem vaststellen;
  • Selecteren relevante data;
  • Incorrecte datawaarden corrigeren;
  • Data transformeren;
  • Datamining;
  • Datamodel maken;
  • Data visualiseren.

Probleem vaststellen

Een collega uit de Business klopt bij de afdeling Data Science aan met een vraag. De Data Scientist doet een uitgebreide uitvraag. Om te voorkomen dat er een ander probleem wordt opgelost dan is aangedragen.

Selecteren relevante data

Financiële dienstverleners verzamelen heel veel data. De Data Scientist is wat dat betreft een kind in een snoepwinkel. Maar niet alle data is relevant om het voorgelegde probleem op te lossen. En dus maakt hij een selectie.

Incorrecte datawaarden corrigeren

Data is heden ten dage nog voor een groot gedeelte mensenwerk. Kortom: ontbrekende waarden of incorrecte waarden zijn er in iedere databron. De Data Scientist trekt de datakwaliteit gelijk.

Data transformeren

Eenheden zijn niet in alle bronnen op dezelfde wijze vastgelegd. De betekenis is gelijk voor een mens van vlees en bloed, maar een machine weet dit niet. Bijvoorbeeld: in bron 1 is Jan 180 centimeter, in bron 2 is hij 1 meter 80. De Data Scientist uniformeert de gebruikte eenheden.

Datamining

De data is nu klaar om geanalyseerd te worden. De Data Scientist doet dit aan de hand van algoritmen met behulp van machine learning. Volledig automatisch dus.

Datamodel maken

Alle data is geanalyseerd. De Data Scientist kan nu een model maken die geïmplementeerd kan worden in dagelijkse business.

Data visualiseren

Een dashboard maakt data inzichtelijk en begrijpelijk voor iedereen die geen dataprofessional is. Visualisatie is essentieel om het eindresultaat te presenteren aan het management.

Wat is het verschil tussen Data Scientist en Data Analist?

In de praktijk worden de functies Data Scientist en Data Analist veelal door elkaar gebruikt. Maar er zijn wel degelijk verschillen. Een Data Scientist is vooral bezig met voorspellingen. Bijvoorbeeld over het toekomstige gedrag van een bepaald type klant. Een Data Analist houdt zich bezig met het inzichtelijk maken van huidig klantgedrag. Maar het grootste verschil is dat de Data Scientist zijn analyse maakt met behulp van Machine Learning. Vaak is de hoeveelheid data groter. Big data dus.

Wat is de rol van datamodellen?

Een dataset moet groot genoeg zijn om gedegen conclusies te kunnen trekken. Data Scientists gebruiken datasets die zo groot zijn dat deze conclusies alleen tot stand kunnen komen met behulp van een gedegen geautomatiseerd datamodel. Een Data Scientist bouwt zelf datamodellen. Eén van de voornaamste verschillen met het werk van Data Engineers, Data Analisten en Datamodel Analisten hierbij is dat de Scientist zoekt naar nieuwe datarelaties die eerder nog niet gelegd zijn. De Data Scientist is de innovator van het datagedreven werken. Out-of-the-box denken is daarom meer van belang dan bij vergelijkbare rollen binnen de Business IT.

Wat heeft een Data Scientist op zijn CV staan?

Het merendeel van de Data Scientists heeft een WO-opleiding afgerond, meestal in een IT-gerelateerde studie. Een Master in Computer Science of Artificial Intelligence is een hele geschikte vooropleiding om als Data Scientist aan de slag te gaan.

Data Science is een jong vakgebied (Data Scientists zijn dus niet zo grijs als onze avatar doet vermoeden). Ondanks het gewicht van de functie is Data Scientist heel vaak de eerste baan die afgestudeerden van met name de eerdergenoemde vooropleidingen.

 

Gerelateerde vacatures

Ben je op zoek naar een nieuwe uitdaging? Onderstaande vacatures zijn mogelijk interessant voor jou!

Procesmanager CDD

HBO
Fulltime
Amersfoort, Utrecht

Customer Due Dilligence (CDD) is één van de meest besproken processen in de huidige bankwereld. Banken krijgen stevige deadlines opgelegd vanuit De Nederlandsche Bank (DNB) en doen er alles aan om ze te behalen.

max4353 lowres
Of neem contact op met Max
Bel Max op 0625104691
Stuur Max een e-mail
Stuur Max een appje!
Bereik Max op LinkedIn

Product Owner

HBO
Fulltime
Amsterdam

De Product Owner is een onmisbare schakel in het Agile werkproces. Je bent de man of vrouw die de klant altijd centraal zet en jij zorgt ervoor dat digitale processen perfect aansluiten bij de klant.

debby konaltempvoortestdaarnaverwijderen
Of neem contact op met Debby
Bel Debby op 06 - 53479604
Stuur Debby een e-mail
Stuur Debby een appje!
Bereik Debby op LinkedIn

Wij werken onder andere voor...

Even kennismaken?

Kom gerust bij ons langs voor een kopje koffie of thee. We zijn reuze nieuwsgierig naar jouw verhaal!

3031 cc coffee 1