Missende data verwijderen
Nu je de volunteer-gegevensset hebt verkend en de structuur en inhoud begrijpt, is het tijd om missende waarden te gaan verwijderen.
In deze oefening verwijder je zowel kolommen als rijen om een subset van de volunteer-gegevensset te maken.
Deze oefening maakt deel uit van de cursus
Preprocessing voor Machine Learning in Python
Oefeninstructies
- Verwijder de kolommen
LatitudeenLongitudeuitvolunteeren sla dit op alsvolunteer_cols. - Maak een subset van
volunteer_colsdoor rijen met missende waarden incategory_descte verwijderen en sla dit op in een nieuwe variabelevolunteer_subset. - Bekijk het
.shape-attribuut vanvolunteer_subsetom te controleren of het gelukt is.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Drop the Latitude and Longitude columns from volunteer
volunteer_cols = ____
# Drop rows with missing category_desc values from volunteer_cols
volunteer_subset = ____
# Print out the shape of the subset
print(____.____)