Aan de slagGa gratis aan de slag

Missende waarden vervangen door constanten

Hoewel het volledig verwijderen van missende data in veel situaties een juiste aanpak kan zijn, kan dit ertoe leiden dat er veel informatie uit je modellen verdwijnt.

Je kunt categorische kolommen tegenkomen waarbij een missende waarde op zichzelf al betekenisvol is, zoals iemand die in een enquête een vraag niet wil beantwoorden. In dit soort gevallen kun je alle missende waarden opvullen met een geheel nieuwe categorie, bijvoorbeeld 'Geen antwoord gegeven'.

Deze oefening maakt deel uit van de cursus

Feature engineering voor Machine Learning in Python

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Print the count of occurrences
print(so_survey_df['Gender']____)
Code bewerken en uitvoeren