Hoe schaars is mijn data?
De meeste gegevenssets bevatten missende waarden, vaak weergegeven als NaN (Not a Number). Als je met Pandas werkt, kun je eenvoudig controleren hoeveel missende waarden er in elke kolom staan.
Laten we uitzoeken hoeveel van de ontwikkelaars die de enquête invulden ervoor kozen hun leeftijd in te vullen (te vinden in de kolom Age van so_survey_df) en hun gender (kolom Gender van so_survey_df).
Deze oefening maakt deel uit van de cursus
Feature engineering voor Machine Learning in Python
Interactieve oefening met praktijkervaring
Probeer deze oefening door deze voorbeeldcode aan te vullen.
# Subset the DataFrame
sub_df = ____
# Print the number of non-missing values
print(sub_df.____)