Décrire des séries temporelles avec des boxplots
Vous devriez toujours explorer la distribution des variables et, comme vous travaillez avec des séries temporelles, vous allez examiner leurs propriétés à l’aide de boxplots et de résumés numériques. Pour rappel, vous pouvez tracer les données d’un DataFrame sous forme de boxplots avec la commande :
df.boxplot(fontsize=6, vert=False)
Remarquez l’ajout du nouveau paramètre vert, qui précise si les boxplots doivent être tracés horizontalement ou verticalement.
Cet exercice fait partie du cours
Visualiser des séries temporelles en Python
Instructions
- Générez un boxplot pour toutes les séries temporelles dans
jobs. - Affichez un résumé statistique numérique de toutes les séries temporelles dans
jobs. - Passez en revue les résultats et affichez le nom de la série temporelle ayant la valeur moyenne la plus élevée et celle présentant la plus grande variabilité (c’est‑à‑dire avec l’écart‑type le plus élevé).
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Generate a boxplot
____.____(fontsize=6, vert=False)
plt.show()
# Generate numerical summaries
print(____)
# Print the name of the time series with the highest mean
print(____)
# Print the name of the time series with the highest variability
print(____)