Cumulatieve statistieken
Cumulatieve statistieken zijn ook handig om samenvattende statistieken in de loop van de tijd bij te houden. In deze oefening bereken je de cumulatieve som en het cumulatieve maximum van de wekelijkse omzet van een afdeling. Zo kun je zien wat de totale omzet tot nu toe is en wat de hoogste wekelijkse omzet tot nu toe was.
Er is een DataFrame sales_1_1 voor je klaargezet met de verkoopgegevens van afdeling 1 van winkel 1. pandas is geladen als pd.
Deze oefening maakt deel uit van de cursus
Datamanipulatie met pandas
Oefeninstructies
- Sorteer de rijen van
sales_1_1op de kolomdatein oplopende volgorde. - Bereken de cumulatieve som van
weekly_salesen voeg die toe als een nieuwe kolom insales_1_1met de naamcum_weekly_sales. - Bereken het cumulatieve maximum van
weekly_salesen voeg dat toe als een kolom met de naamcum_max_sales. - Print de kolommen
date,weekly_sales,cum_weekly_salesencum_max_sales.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Sort sales_1_1 by date
sales_1_1 = ____
# Get the cumulative sum of weekly_sales, add as cum_weekly_sales col
sales_1_1[____] = ____
# Get the cumulative max of weekly_sales, add as cum_max_sales col
____
# See the columns you calculated
print(sales_1_1[["date", "weekly_sales", "cum_weekly_sales", "cum_max_sales"]])