Omgaan met ontbrekende data
Het is belangrijk om ontbrekende waarden aan te pakken voordat je met je analyse begint.
Eén aanpak is om ontbrekende waarden te verwijderen als ze maar een klein deel van je data vormen, meestal zo’n vijf procent.
Je werkt met een gegevensset over vliegticketprijzen, opgeslagen als een pandas DataFrame genaamd planes. Je gaat het aantal ontbrekende waarden over alle kolommen tellen, vijf procent van alle waarden berekenen, deze drempel gebruiken om observaties te verwijderen en controleren hoeveel ontbrekende waarden er daarna nog in de gegevensset staan.
Deze oefening maakt deel uit van de cursus
Exploratory Data Analysis in Python
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Count the number of missing values in each column
print(____)