Numerieke samenvattingen berekenen
Je hebt geleerd hoe je tijdreeksgegevens op verschillende manieren kunt weergeven en annoteren, maar het is ook nuttig om samenvattende statistieken van je data te verzamelen. Als je dit kunt, kun je de statistische eigenschappen van je data delen en bespreken, wat de grafieken die je maakt extra kan ondersteunen. In pandas kun je snel samenvattingen van kolommen in je DataFrame krijgen met het commando:
print(df.describe())
Dit geeft statistieken weer zoals het gemiddelde, de standaarddeviatie, de minima en maxima, en het aantal waarnemingen voor alle numerieke kolommen in je pandas DataFrame.
Deze oefening maakt deel uit van de cursus
Tijdreeksen visualiseren in Python
Oefeninstructies
- Print de statistische samenvattingen van de
co2_levelsDataFrame. - Print de gerapporteerde minimumwaarde in de
co2_levelsDataFrame. - Print de gerapporteerde maximumwaarde in de
co2_levelsDataFrame.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Print out summary statistics of the co2_levels DataFrame
print(____.____)
# Print out the minima of the co2 column in the co2_levels DataFrame
print(____)
# Print out the maxima of the co2 column in the co2_levels DataFrame
print(____)