Afronden met de weergegevens
Wanneer is afronden handig? In veel van dezelfde situaties waarin het nuttig is om datumonderdelen te extraheren. Het voordeel van afronden ten opzichte van extraheren is dat de context van de eenheid behouden blijft. Als je bijvoorbeeld het uur extraheert, krijg je het uur waarin de datetime viel, maar verlies je de dag waarop dat uur viel (tenzij je die ook extraheert). Als je daarentegen afrondt op het dichtstbijzijnde uur, blijven dag, maand en jaar behouden.
Als voorbeeld ga je onderzoeken hoeveel observaties per uur er daadwerkelijk zijn in de uurlijkse weergegevens van Auckland.
Deze oefening maakt deel uit van de cursus
Werken met datums en tijden in R
Oefeninstructies
- Maak een nieuwe kolom
day_hourdiedatetimenaar beneden afgerond op het dichtstbijzijnde uur bevat. - Gebruik
count()opday_hourom te tellen hoeveel observaties er in elk uur zijn. Wat lijkt de meest voorkomende waarde? - Breid de pipeline uit zodat je na het tellen filtert op observaties waarbij
nniet gelijk is aan2.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create day_hour, datetime rounded down to hour
akl_hourly <- akl_hourly %>%
mutate(
day_hour = ___(datetime, unit = ___)
)
# Count observations per hour
akl_hourly %>%
count(___)
# Find day_hours with n != 2
akl_hourly %>%
count(___) %>%
filter(___) %>%
arrange(desc(n))