Subsetten van tijdreeksgegevens
Bij het plotten van tijdreeksgegevens wil je soms alleen een deelverzameling visualiseren. De pandas-bibliotheek biedt krachtige indexeer- en subsetmethoden waarmee je specifieke delen van een DataFrame kunt ophalen. Zo kun je bijvoorbeeld alle gegevens tussen 1950 en 1960 uit het discoveries DataFrame selecteren door het volgende datumbereik op te geven:
subset_data = discoveries['1950-01-01':'1960-01-01']
Let op: Op deze manier subsetten kan alleen als de index van je DataFrame datums van het type datetime bevat. Anders geeft de pandas-bibliotheek een foutmelding.
Deze oefening maakt deel uit van de cursus
Tijdreeksen visualiseren in Python
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Select the subset of data between 1945 and 1950
discoveries_subset_1 = discoveries['____':'____']
# Plot the time series in your DataFrame as a blue area chart
ax = discoveries_subset_1.____(color='blue', fontsize=15)
# Show plot
plt.show()