Aan de slagGa gratis aan de slag

Missende data verwijderen

Nu je de volunteer-gegevensset hebt verkend en de structuur en inhoud begrijpt, is het tijd om missende waarden te gaan verwijderen.

In deze oefening verwijder je zowel kolommen als rijen om een subset van de volunteer-gegevensset te maken.

Deze oefening maakt deel uit van de cursus

Preprocessing voor Machine Learning in Python

Cursus bekijken

Oefeninstructies

  • Verwijder de kolommen Latitude en Longitude uit volunteer en sla dit op als volunteer_cols.
  • Maak een subset van volunteer_cols door rijen met missende waarden in category_desc te verwijderen en sla dit op in een nieuwe variabele volunteer_subset.
  • Bekijk het .shape-attribuut van volunteer_subset om te controleren of het gelukt is.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Drop the Latitude and Longitude columns from volunteer
volunteer_cols = ____

# Drop rows with missing category_desc values from volunteer_cols
volunteer_subset = ____

# Print out the shape of the subset
print(____.____)
Code bewerken en uitvoeren