CommencerCommencer gratuitement

Encoder et tracer les données des Red Sox

Après avoir exploré et manipulé des données sur les vols, la météo et l’économie, votre client veut couvrir tous les terrains. Logiquement, il souhaite que vous rassembliez des données sur les principales équipes sportives de Boston : les Boston Red Sox (baseball), les New England Patriots (football américain), les Boston Bruins (hockey) et les Boston Celtics (basket-ball). Dans ce chapitre, vous préparerez des données sur le calendrier et les résultats de tous les matchs impliquant ces équipes de 2010 à 2015. C’est l’occasion idéale de vous exercer encore à la manipulation de séries temporelles !

Pour commencer, vous avez compilé des données sur les matchs des Boston Red Sox entre 2010 et 2015. Dans cet exercice, vous allez explorer ces données, les encoder en xts et tracer certaines tendances dans le temps. Le data frame redsox est disponible dans votre espace de travail.

Cet exercice fait partie du cours

Étude de cas : analyser des séries temporelles urbaines en R

Afficher le cours

Instructions

  • Utilisez summary() pour afficher des statistiques descriptives sur vos données redsox. Repérez la colonne de date et vérifiez si vous avez des données manquantes (NA) à traiter.
  • Une fois que vous êtes sûr que les données redsox peuvent être converties en xts, commencez par encoder la colonne date en objet temporel avec as.Date().
  • Utilisez as.xts() pour convertir vos données redsox en xts, en veillant à préciser order.by avec la colonne date. Supprimez également la colonne date (en utilisant la notation [, -1]) afin que votre objet xts soit numérique.
  • Utilisez plot.zoo() pour tracer l’évolution des scores des Red Sox (boston_score) et des adversaires (opponent_score) dans le temps. Quelles tendances pouvez-vous identifier à partir de ces graphiques ?

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# View summary information about your redsox data


# Convert the date column to a time-based format
redsox$date <- as.Date(___$___)

# Convert your red sox data to xts
redsox_xts <- as.xts(___[,-1], order.by = ___$___)

# Plot the Red Sox score and the opponent score over time
plot.zoo(___[, c("___", "___")])
Modifier et exécuter le code