Cumulatieve som vs .diff()
In de video heb je geleerd over expanding windows waarmee je cumulatieve berekeningen kunt uitvoeren.
De methode voor de cumulatieve som heeft eigenlijk het omgekeerde effect van de methode .diff() die je in hoofdstuk 1 bent tegengekomen.
Om dit te laten zien, gebruiken we de tijdreeks met Google-aandelenkoersen, berekenen we de verschillen tussen de prijzen en reconstrueren we de reeks met de cumulatieve som.
Deze oefening maakt deel uit van de cursus
Tijdreeksgegevens manipuleren in Python
Oefeninstructies
We hebben pandas al geïmporteerd als pd en matplotlib.pyplot als plt. We hebben ook de Google-aandelenkoersen geladen in de variabele data.
- Pas
.diff()toe opdata, verwijder missende waarden en wijs het resultaat toe aandifferences. - Gebruik
.first('D')om de eerste prijs uitdatate selecteren en wijs die toe aanstart_price. - Gebruik
.append()omstart_priceendifferenceste combineren, pas.cumsum()toe en wijs dit toe aancumulative_sum. - Gebruik
.equals()omdataencumulative_sumte vergelijken en print het resultaat.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Calculate differences
differences = ____
# Select start price
start_price = ____
# Calculate cumulative sum
cumulative_sum = ____
# Validate cumulative sum equals data
print(____)