Codificando e plotando dados do Red Sox
Depois de explorar e manipular dados sobre voos, clima e economia, seu cliente quer cobrir todas as bases. Naturalmente, eles querem que você colete dados dos principais times esportivos de Boston: Boston Red Sox (beisebol), New England Patriots (futebol americano), Boston Bruins (hóquei) e Boston Celtics (basquete). Neste capítulo, você vai preparar dados sobre o calendário e o resultado de todos os jogos envolvendo esses times de 2010 a 2015. É uma ótima oportunidade para praticar ainda mais a manipulação de dados de séries temporais!
Para começar, você reuniu dados dos jogos do Boston Red Sox de 2010 a 2015. Neste exercício, você vai explorar os dados, codificá-los em xts e plotar algumas tendências ao longo do tempo. O data frame redsox está disponível no seu ambiente de trabalho.
Este exercício faz parte do curso
Estudo de Caso: Analisando Séries Temporais de Cidades em R
Instruções do exercício
- Use
summary()para visualizar estatísticas resumidas do seu conjuntoredsox. Fique de olho na coluna de data e verifique se há dados ausentes (NAs) que precisam ser tratados. - Quando estiver confiante de que os dados de
redsoxpodem ser convertidos para xts, inicie o processo codificando a colunadatepara um objeto baseado em tempo usandoas.Date(). - Use
as.xts()para converter seus dadosredsoxem xts, garantindo queorder.byseja a colunadate. Remova também a coluna de data (usando a notação[, -1]) para assegurar que seu objeto xts seja numérico. - Use
plot.zoo()para plotar as pontuações do Red Sox (boston_score) e as pontuações dos adversários (opponent_score) ao longo do tempo. Que tendências você consegue identificar nesses gráficos?
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# View summary information about your redsox data
# Convert the date column to a time-based format
redsox$date <- as.Date(___$___)
# Convert your red sox data to xts
redsox_xts <- as.xts(___[,-1], order.by = ___$___)
# Plot the Red Sox score and the opponent score over time
plot.zoo(___[, c("___", "___")])