Missende tijdreeksgegevens invullen
Tijdreeksgegevens imputeren vraagt om een specifieke aanpak. Tijdreeksen hebben vaak eigenschappen zoals trend, seizoensgebondenheid en cycli, die we kunnen benutten bij het invullen van ontbrekende waarden. In de airquality DataFrame kun je deze kenmerken terugzien. Je doel is om de waarden zo te imputeren dat met deze eigenschappen rekening wordt gehouden.
In deze oefening ga je de methode .fillna() gebruiken om tijdreeksgegevens te imputeren. Je past de forward fill- en backward fill-strategieën toe voor het imputeren van tijdreeksdata.
Deze oefening maakt deel uit van de cursus
Omgaan met ontbrekende gegevens in Python
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Print prior to imputing missing values
print(airquality[30:40])
# Fill NaNs using forward fill
airquality.___(___, inplace=True)
# Print after imputing missing values
print(airquality[30:40])