ComenzarEmpieza gratis

Describe datos de series temporales con diagramas de caja

Siempre deberías explorar la distribución de las variables y, como estás trabajando con series temporales, vas a explorar sus propiedades usando diagramas de caja y resúmenes numéricos. Como recordatorio, puedes representar los datos de un DataFrame como diagramas de caja con el comando:

df.boxplot(fontsize=6, vert=False)

Fíjate en la introducción del nuevo parámetro vert, que especifica si dibujar los diagramas de caja en horizontal o en vertical.

Este ejercicio forma parte del curso

Visualización de datos temporales en Python

Ver curso

Instrucciones del ejercicio

  • Genera un diagrama de caja de todas las series temporales en jobs.
  • Imprime un resumen estadístico numérico de todas las series temporales en jobs.
  • Revisa los resultados e imprime el nombre de la serie temporal con el mayor valor medio y la de mayor variabilidad (es decir, con la desviación estándar más alta).

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Generate a boxplot
____.____(fontsize=6, vert=False)
plt.show()

# Generate numerical summaries
print(____)

# Print the name of the time series with the highest mean
print(____)

# Print the name of the time series with the highest variability
print(____)
Editar y ejecutar código