Meerdere tijdreeksen laden
Of het nu in persoonlijke projecten is of in je dagelijkse werk als Data Scientist, de kans is groot dat je situaties tegenkomt waarin je meerdere tijdreeksen tegelijk moet analyseren en visualiseren.
Als de data voor elke tijdreeks in aparte kolommen van een bestand staat, maakt de pandas-bibliotheek het eenvoudig om met meerdere tijdreeksen te werken. In de volgende oefeningen werk je met een nieuwe tijdreeksgegevensset met de hoeveelheid geproduceerd vlees per type in de VS tussen 1944 en 2012.
Deze oefening maakt deel uit van de cursus
Tijdreeksen visualiseren in Python
Oefeninstructies
We hebben pandas geïmporteerd met de alias pd.
- Lees het csv-bestand op
url_meatin een DataFrame met de naammeat. - Zet de kolom
dateinmeatom naar het typedatetime. - Stel de kolom
datein als de index vanmeat. - Print de samenvattende statistieken van alle numerieke kolommen in
meat.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Read in meat DataFrame
meat = ____.____(____)
# Review the first five lines of the meat DataFrame
print(meat.head(5))
# Convert the date column to a datestamp type
meat['date'] = ____(____)
# Set the date column as the index of your DataFrame meat
meat = ____.____(____)
# Print the summary statistics of the DataFrame
print(meat.____)