Extraction pour la visualisation
Extraire des composantes à partir d’un datetime est particulièrement utile pour explorer des données. Plus tôt dans le chapitre, vous avez importé des données quotidiennes sur la météo à Auckland et créé une série temporelle des températures maximales quotidiennes sur dix ans. Ce graphique donne une bonne vue d’ensemble de la décennie, mais il est difficile d’y voir le motif annuel.
Dans cet exercice, vous allez utiliser des composantes des dates pour explorer l’évolution de la température maximale au fil de l’année. La première étape consiste à créer de nouvelles colonnes pour stocker les éléments extraits, puis vous les utiliserez dans deux graphiques.
Cet exercice fait partie du cours
Travailler avec les dates et heures en R
Instructions
- Utilisez
mutate()pour créer trois nouvelles colonnes :year,ydayetmonthqui contiennent respectivement les mêmes composantes que la colonnedate. N’oubliez pas d’étiqueter les mois avec leurs noms. - Créez un graphique avec
ydaysur l’axe des x,max_tempsur l’axe des y, où les lignes sont groupées paryear. Chaque année correspond à une ligne sur ce graphique, avec l’axe des x allant du 1er janv. au 31 déc. - Pour une autre perspective, créez un ridgeline plot (anciennement appelé joyplot) avec
max_tempsur l’axe des x,monthsur l’axe des y, en utilisantgeom_density_ridges()du packageggridges.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
library(ggplot2)
library(dplyr)
library(ggridges)
# Add columns for year, yday and month
akl_daily <- akl_daily %>%
mutate(
___ = ___(date),
___ = ___(date),
___ = ___(date, ___))
# Plot max_temp by yday for all years
ggplot(akl_daily, aes(x = ___, y = ___)) +
geom_line(aes(group = ___), alpha = 0.5)
# Examine distribution of max_temp by month
ggplot(akl_daily, aes(x = ___, y = ___, height = ..density..)) +
geom_density_ridges(stat = "density")