Estrazione per filtrare e riassumere
Un altro motivo per estrarre componenti è aiutarti a filtrare le osservazioni o creare riepiloghi. Per esempio, se ti interessano solo le osservazioni dei giorni feriali (cioè non nei weekend), puoi estrarre i giorni della settimana e poi filtrare i weekend, ad es. wday(date) %in% 2:6.
Nell’ultimo esercizio hai visto che gennaio, febbraio e marzo sono ottimi mesi per visitare Auckland per le temperature miti, ma ti servirà un impermeabile?
In questo esercizio lo scoprirai! Userai i dati orari per calcolare in quanti giorni di ciascun mese ha piovuto durante il giorno.
Questo esercizio fa parte del corso
Lavorare con date e orari in R
Istruzioni dell'esercizio
- Crea nuove colonne per l’ora e il mese dell’osservazione a partire da
datetime. Assicurati di etichettare il mese. - Filtra solo le osservazioni diurne, in cui l’ora è maggiore o uguale a
8e minore o uguale a22. - Raggruppa le osservazioni prima per
month, poi perdate, e riassumi usandoany()sulla colonnarainy. Questo produce un valore per giorno - Riassumi di nuovo sommando
any_rain. Questo produce un valore per mese
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Create new columns hour, month and rainy
akl_hourly <- akl_hourly %>%
mutate(
___ = ___(datetime),
___ = ___(datetime, ___),
rainy = weather == "Precipitation"
)
# Filter for hours between 8am and 10pm (inclusive)
akl_day <- akl_hourly %>%
filter(___, ___)
# Summarise for each date if there is any rain
rainy_days <- akl_day %>%
group_by(___, ___) %>%
summarise(
any_rain = ___(rainy)
)
# Summarise for each month, the number of days with rain
rainy_days %>%
summarise(
days_rainy = ___(any_rain)
)