Tijdreeksen beschrijven met boxplots
Je zou altijd de verdeling van de variabelen moeten verkennen, en omdat je met tijdreeksen werkt, ga je hun eigenschappen onderzoeken met boxplots en numerieke samenvattingen. Ter herinnering: je kunt gegevens in een DataFrame als boxplots plotten met het commando:
df.boxplot(fontsize=6, vert=False)
Let op de introductie van de nieuwe parameter vert, die aangeeft of de boxplots horizontaal of verticaal moeten worden geplot.
Deze oefening maakt deel uit van de cursus
Tijdreeksen visualiseren in Python
Oefeninstructies
- Genereer een boxplot van alle tijdreeksen in
jobs. - Print een numerieke statistische samenvatting van alle tijdreeksen in
jobs. - Bekijk de resultaten en print de naam van de tijdreeks met de hoogste gemiddelde waarde en met de meeste variabiliteit (dus met de hoogste standaarddeviatie).
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Generate a boxplot
____.____(fontsize=6, vert=False)
plt.show()
# Generate numerical summaries
print(____)
# Print the name of the time series with the highest mean
print(____)
# Print the name of the time series with the highest variability
print(____)