or
Deze oefening maakt deel uit van de cursus
We beginnen de cursus met een definitie van data science. We behandelen de data science-workflow en hoe data science wordt toegepast op problemen uit de praktijk. We sluiten het hoofdstuk af met een overzicht van verschillende rollen binnen het data science-veld.
Nu we de data science-workflow begrijpen, duiken we dieper in de eerste stap: dataverzameling en -opslag. We leren over de verschillende databronnen waar je uit kunt putten, hoe die data eruitziet, hoe je de data opslaat zodra die is verzameld, en hoe een datapijplijn het proces kan automatiseren.
Huidige oefening
Datavoorbereiding is essentieel: data scientists besteden 80% van hun tijd aan het opschonen en bewerken van data, en slechts 20% aan het daadwerkelijk analyseren ervan. In dit hoofdstuk leer je problemen in je data herkennen en omgaan met missende waarden en uitschieters. Daarna ga je aan de slag met visualisatie, een onmisbaar hulpmiddel om je data te verkennen én je bevindingen duidelijk over te brengen.
In dit laatste hoofdstuk bespreken we experimenteren en voorspellen! We beginnen met experimenten en behandelen A/B-testen. Daarna gaan we naar tijdreeksvoorspellingen, waar we leren hoe je toekomstige gebeurtenissen kunt voorspellen. Tot slot eindigen we met Machine Learning en kijken we naar supervised learning en clustering.