Descrever dados de séries temporais com boxplots
Você sempre deve explorar a distribuição das variáveis e, como está trabalhando com séries temporais, vai analisar suas propriedades usando boxplots e resumos numéricos. Para relembrar, você pode plotar dados de um DataFrame como boxplots com o comando:
df.boxplot(fontsize=6, vert=False)
Perceba a introdução do novo parâmetro vert, que especifica se os boxplots serão plotados na horizontal ou na vertical.
Este exercício faz parte do curso
Visualizing Time Series Data in Python
Instruções do exercício
- Gere um boxplot de todas as séries temporais em
jobs. - Imprima um resumo estatístico numérico de todas as séries temporais em
jobs. - Confira os resultados e imprima o nome da série temporal com o maior valor médio e a com maior variabilidade (isto é, com o maior desvio padrão).
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Generate a boxplot
____.____(fontsize=6, vert=False)
plt.show()
# Generate numerical summaries
print(____)
# Print the name of the time series with the highest mean
print(____)
# Print the name of the time series with the highest variability
print(____)