Is dit Missing at Random?
In de video-oefening zag je dat er verschillende soorten missendheid bestaan wanneer je met missende data te maken hebt. Ter herinnering, typen missendheid kunnen als volgt worden beschreven:
- Missing Completely at Random: Geen systematische relatie tussen de missende waarden in een kolom en andere of eigen waarden.
- Missing at Random: Er is een systematische relatie tussen de missende waarden in een kolom en andere geobserveerde waarden.
- Missing Not at Random: Er is een systematische relatie tussen de missende waarden in een kolom en niet-geobserveerde waarden.
Je hebt een DataFrame met klanttevredenheidsscores voor een service. Welk type missendheid is dit?
Een satisfaction_score kolom met missende waarden voor zeer ontevreden klanten.
Deze oefening maakt deel uit van de cursus
Data opschonen in Python
Praktische interactieve oefening
Zet theorie om in actie met een van onze interactieve oefeningen.
Begin met trainen