Encoder et tracer les données des Red Sox
Après avoir exploré et manipulé des données sur les vols, la météo et l’économie, votre client veut couvrir tous les terrains. Logiquement, il souhaite que vous rassembliez des données sur les principales équipes sportives de Boston : les Boston Red Sox (baseball), les New England Patriots (football américain), les Boston Bruins (hockey) et les Boston Celtics (basket-ball). Dans ce chapitre, vous préparerez des données sur le calendrier et les résultats de tous les matchs impliquant ces équipes de 2010 à 2015. C’est l’occasion idéale de vous exercer encore à la manipulation de séries temporelles !
Pour commencer, vous avez compilé des données sur les matchs des Boston Red Sox entre 2010 et 2015. Dans cet exercice, vous allez explorer ces données, les encoder en xts et tracer certaines tendances dans le temps. Le data frame redsox est disponible dans votre espace de travail.
Cet exercice fait partie du cours
Étude de cas : analyser des séries temporelles urbaines en R
Instructions
- Utilisez
summary()pour afficher des statistiques descriptives sur vos donnéesredsox. Repérez la colonne de date et vérifiez si vous avez des données manquantes (NA) à traiter. - Une fois que vous êtes sûr que les données
redsoxpeuvent être converties en xts, commencez par encoder la colonnedateen objet temporel avecas.Date(). - Utilisez
as.xts()pour convertir vos donnéesredsoxen xts, en veillant à préciserorder.byavec la colonnedate. Supprimez également la colonne date (en utilisant la notation[, -1]) afin que votre objet xts soit numérique. - Utilisez
plot.zoo()pour tracer l’évolution des scores des Red Sox (boston_score) et des adversaires (opponent_score) dans le temps. Quelles tendances pouvez-vous identifier à partir de ces graphiques ?
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# View summary information about your redsox data
# Convert the date column to a time-based format
redsox$date <- as.Date(___$___)
# Convert your red sox data to xts
redsox_xts <- as.xts(___[,-1], order.by = ___$___)
# Plot the Red Sox score and the opponent score over time
plot.zoo(___[, c("___", "___")])