Subsetten en periodiciteit aanpassen
Je volgende stap is om je temperatuurgegevens te mergen met de vluchtgegevens uit de vorige hoofdstuk.
Herinner je uit het vorige hoofdstuk dat je vluchtgegevens lopen van 2010 tot en met 2015 in maandelijkse perioden. Je temperatuurgegevens daarentegen lopen van 2007 tot en met 2015 in dagelijkse perioden. Voordat je merge’t, moet je je gegevens subsetten en de periodiciteit aanpassen naar maandelijks.
Om de periodiciteit van xts-objecten te converteren, kun je to.period() gebruiken. Hiermee zet je je data snel om naar een lagere frequentie. Standaard levert dit commando specifieke waarden over de hele periode (namelijk Open-High-Low-Close, of OHLC), wat handig is in financiële analyses maar niet altijd relevant.
In dit geval zet je het argument OHLC op FALSE. In plaats van OHLC-kolommen te maken in je maandelijkse xts-object, neemt deze instelling simpelweg één rij per periode als representatief voor de hele periode. Met het argument indexAt kun je aangeven welke rij je wilt gebruiken.
Zowel de temps_xts-data als de flights_xts-data (uit het vorige hoofdstuk) staan voor je klaar in je werkruimte.
Deze oefening maakt deel uit van de cursus
Casestudy: Tijdreeksgegevens van een stad analyseren in R
Oefeninstructies
- Subset je
temps_xts-object zodat het alleen observaties van 2010 t/m 2015 bevat. Sla dit op alstemps_xts_2. - Gebruik
to.period()om je dagelijkse temperatuurgegevens om te zetten naar maandelijkse periodiciteit. Geef de gewenste periode op ("months"). Zet ookOHLCopFALSEom te voorkomen dat er nieuwe OHLC-kolommen worden gemaakt. Zet ten slotte het argumentindexAtop"firstof"om elke maand de eerste observatie te selecteren. - Gebruik twee aanroepen van
periodicity()om de periodiciteit en duur van je nieuwe maandelijkse temperatuurgegevens te vergelijken met deflights_xts-data uit het vorige hoofdstuk.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Subset your temperature data to include only 2010 through 2015: temps_xts_2
temps_xts_2 <- ___["___/___"]
# Use to.period to convert temps_xts_2 to monthly periodicity
temps_monthly <- to.period(___, period = "___", OHLC = ___, indexAt = "___")
# Compare the periodicity and duration of temps_monthly and flights_xts
periodicity(___)
periodicity(___)