Imputeren met de interpolate-methode
Tijdreeksgegevens vertonen stijgende en dalende trends in de tijd. Daarom is het opvullen met vlakke reeksen waarden, zoals met forward fill of backward fill, niet geschikt. Een betere aanpak is lineair of kwadratisch imputeren, waarbij je waarden invult die geleidelijk toenemen of afnemen.
In deze oefening werk je met de methode .interpolate() op de airquality-DataFrame. Je gebruikt de methodes linear, quadratic en nearest. Een volledige lijst met interpolatiestrategieën vind je hier.
Deze oefening maakt deel uit van de cursus
Omgaan met ontbrekende gegevens in Python
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Print prior to interpolation
print(airquality[30:40])
# Interpolate the NaNs linearly
airquality.interpolate(___, inplace=True)
# Print after interpolation
print(airquality[30:40])