Aan de slagBegin gratis

Subsetten van tijdreeksgegevens

Bij het plotten van tijdreeksgegevens wil je soms alleen een deelverzameling visualiseren. De pandas-bibliotheek biedt krachtige indexeer- en subsetmethoden waarmee je specifieke delen van een DataFrame kunt ophalen. Zo kun je bijvoorbeeld alle gegevens tussen 1950 en 1960 uit het discoveries DataFrame selecteren door het volgende datumbereik op te geven:

subset_data = discoveries['1950-01-01':'1960-01-01']

Let op: Op deze manier subsetten kan alleen als de index van je DataFrame datums van het type datetime bevat. Anders geeft de pandas-bibliotheek een foutmelding.

Deze oefening maakt deel uit van de cursus

Tijdreeksen visualiseren in Python

Bekijk cursus

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Select the subset of data between 1945 and 1950
discoveries_subset_1 = discoveries['____':'____']

# Plot the time series in your DataFrame as a blue area chart
ax = discoveries_subset_1.____(color='blue', fontsize=15)

# Show plot
plt.show()
Code bewerken en uitvoeren