CommencerCommencer gratuitement

Décrire des séries temporelles avec des boxplots

Vous devriez toujours explorer la distribution des variables et, comme vous travaillez avec des séries temporelles, vous allez examiner leurs propriétés à l’aide de boxplots et de résumés numériques. Pour rappel, vous pouvez tracer les données d’un DataFrame sous forme de boxplots avec la commande :

df.boxplot(fontsize=6, vert=False)

Remarquez l’ajout du nouveau paramètre vert, qui précise si les boxplots doivent être tracés horizontalement ou verticalement.

Cet exercice fait partie du cours

Visualiser des séries temporelles en Python

Afficher le cours

Instructions

  • Générez un boxplot pour toutes les séries temporelles dans jobs.
  • Affichez un résumé statistique numérique de toutes les séries temporelles dans jobs.
  • Passez en revue les résultats et affichez le nom de la série temporelle ayant la valeur moyenne la plus élevée et celle présentant la plus grande variabilité (c’est‑à‑dire avec l’écart‑type le plus élevé).

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Generate a boxplot
____.____(fontsize=6, vert=False)
plt.show()

# Generate numerical summaries
print(____)

# Print the name of the time series with the highest mean
print(____)

# Print the name of the time series with the highest variability
print(____)
Modifier et exécuter le code