Aan de slagGa gratis aan de slag

Tijdreeksen beschrijven met boxplots

Je zou altijd de verdeling van de variabelen moeten verkennen, en omdat je met tijdreeksen werkt, ga je hun eigenschappen onderzoeken met boxplots en numerieke samenvattingen. Ter herinnering: je kunt gegevens in een DataFrame als boxplots plotten met het commando:

df.boxplot(fontsize=6, vert=False)

Let op de introductie van de nieuwe parameter vert, die aangeeft of de boxplots horizontaal of verticaal moeten worden geplot.

Deze oefening maakt deel uit van de cursus

Tijdreeksen visualiseren in Python

Cursus bekijken

Oefeninstructies

  • Genereer een boxplot van alle tijdreeksen in jobs.
  • Print een numerieke statistische samenvatting van alle tijdreeksen in jobs.
  • Bekijk de resultaten en print de naam van de tijdreeks met de hoogste gemiddelde waarde en met de meeste variabiliteit (dus met de hoogste standaarddeviatie).

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Generate a boxplot
____.____(fontsize=6, vert=False)
plt.show()

# Generate numerical summaries
print(____)

# Print the name of the time series with the highest mean
print(____)

# Print the name of the time series with the highest variability
print(____)
Code bewerken en uitvoeren