Omgaan met missende waarden
Om missende waarden in je tijdreeksgegevens te vervangen, kun je het volgende commando gebruiken:
df = df.fillna(method="ffill")
waarmee je met het argument aangeeft welke methode je wilt gebruiken. Als je bijvoorbeeld bfill (backfilling) opgeeft, worden missende waarden vervangen door de eerstvolgende geldige observatie, terwijl ffill (forward-filling) ervoor zorgt dat missende waarden worden vervangen door de laatst bekende geldige observatie.
Herinner je uit de vorige oefening dat co2_levels 59 missende waarden heeft.
Deze oefening maakt deel uit van de cursus
Tijdreeksen visualiseren in Python
Oefeninstructies
- Imputeer deze missende waarden in
co2_levelsmet backfilling. - Print het totale aantal missende waarden.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Impute missing values with the next valid observation
co2_levels = co2_levels.____(method=____)
# Print out the number of missing values
____(____.____())