Describe datos de series temporales con diagramas de caja
Siempre deberías explorar la distribución de las variables y, como estás trabajando con series temporales, vas a explorar sus propiedades usando diagramas de caja y resúmenes numéricos. Como recordatorio, puedes representar los datos de un DataFrame como diagramas de caja con el comando:
df.boxplot(fontsize=6, vert=False)
Fíjate en la introducción del nuevo parámetro vert, que especifica si dibujar los diagramas de caja en horizontal o en vertical.
Este ejercicio forma parte del curso
Visualización de datos temporales en Python
Instrucciones del ejercicio
- Genera un diagrama de caja de todas las series temporales en
jobs. - Imprime un resumen estadístico numérico de todas las series temporales en
jobs. - Revisa los resultados e imprime el nombre de la serie temporal con el mayor valor medio y la de mayor variabilidad (es decir, con la desviación estándar más alta).
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Generate a boxplot
____.____(fontsize=6, vert=False)
plt.show()
# Generate numerical summaries
print(____)
# Print the name of the time series with the highest mean
print(____)
# Print the name of the time series with the highest variability
print(____)