Missende waarden vervangen door constanten
Hoewel het volledig verwijderen van missende data in veel situaties een juiste aanpak kan zijn, kan dit ertoe leiden dat er veel informatie uit je modellen verdwijnt.
Je kunt categorische kolommen tegenkomen waarbij een missende waarde op zichzelf al betekenisvol is, zoals iemand die in een enquête een vraag niet wil beantwoorden. In dit soort gevallen kun je alle missende waarden opvullen met een geheel nieuwe categorie, bijvoorbeeld 'Geen antwoord gegeven'.
Deze oefening maakt deel uit van de cursus
Feature engineering voor Machine Learning in Python
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Print the count of occurrences
print(so_survey_df['Gender']____)