Codificar y graficar datos de los Red Sox
Después de explorar y manipular datos de vuelos, clima y economía, tu cliente quiere cubrir todas las bases. Naturalmente, le gustaría que recopiles datos de los principales equipos deportivos de Boston: los Boston Red Sox (béisbol), los New England Patriots (fútbol americano), los Boston Bruins (hockey) y los Boston Celtics (baloncesto). En este capítulo, prepararás datos sobre el calendario y el resultado de todos los partidos de estos equipos entre 2010 y 2015. Es una oportunidad perfecta para seguir practicando la manipulación de series temporales.
Para empezar, has reunido datos de los partidos jugados por los Boston Red Sox de 2010 a 2015. En este ejercicio, explorarás los datos, los codificarás a xts y trazarás algunas tendencias en el tiempo. El data frame redsox está disponible en tu espacio de trabajo.
Este ejercicio forma parte del curso
Estudio de caso: Análisis de series temporales de una ciudad en R
Instrucciones del ejercicio
- Usa
summary()para ver algunas estadísticas descriptivas de tus datosredsox. Fíjate en la columna de fechas y comprueba si hay datos faltantes (NA) que debas resolver. - Cuando confirmes que los datos de
redsoxse pueden convertir a xts, empieza codificando la columnadatecomo objeto basado en tiempo usandoas.Date(). - Usa
as.xts()para convertir tus datosredsoxa xts, asegurándote de usarorder.bycon la columnadate. Además, elimina la columna de fecha (usando la notación[, -1]) para que tu objeto xts sea numérico. - Usa
plot.zoo()para graficar las puntuaciones de los Red Sox (boston_score) y las del rival (opponent_score) a lo largo del tiempo. ¿Qué tendencias puedes identificar en estos gráficos?
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# View summary information about your redsox data
# Convert the date column to a time-based format
redsox$date <- as.Date(___$___)
# Convert your red sox data to xts
redsox_xts <- as.xts(___[,-1], order.by = ___$___)
# Plot the Red Sox score and the opponent score over time
plot.zoo(___[, c("___", "___")])