Aan de slagGa gratis aan de slag

Subsetten van tijdreeksgegevens

Bij het plotten van tijdreeksgegevens wil je soms alleen een deelverzameling visualiseren. De pandas-bibliotheek biedt krachtige indexeer- en subsetmethoden waarmee je specifieke delen van een DataFrame kunt ophalen. Zo kun je bijvoorbeeld alle gegevens tussen 1950 en 1960 uit het discoveries DataFrame selecteren door het volgende datumbereik op te geven:

subset_data = discoveries['1950-01-01':'1960-01-01']

Let op: Op deze manier subsetten kan alleen als de index van je DataFrame datums van het type datetime bevat. Anders geeft de pandas-bibliotheek een foutmelding.

Deze oefening maakt deel uit van de cursus

Tijdreeksen visualiseren in Python

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Select the subset of data between 1945 and 1950
discoveries_subset_1 = discoveries['____':'____']

# Plot the time series in your DataFrame as a blue area chart
ax = discoveries_subset_1.____(color='blue', fontsize=15)

# Show plot
plt.show()
Code bewerken en uitvoeren