Aan de slagGa gratis aan de slag

Meerdere tijdreeksen laden

Of het nu in persoonlijke projecten is of in je dagelijkse werk als Data Scientist, de kans is groot dat je situaties tegenkomt waarin je meerdere tijdreeksen tegelijk moet analyseren en visualiseren.

Als de data voor elke tijdreeks in aparte kolommen van een bestand staat, maakt de pandas-bibliotheek het eenvoudig om met meerdere tijdreeksen te werken. In de volgende oefeningen werk je met een nieuwe tijdreeksgegevensset met de hoeveelheid geproduceerd vlees per type in de VS tussen 1944 en 2012.

Deze oefening maakt deel uit van de cursus

Tijdreeksen visualiseren in Python

Cursus bekijken

Oefeninstructies

We hebben pandas geïmporteerd met de alias pd.

  • Lees het csv-bestand op url_meat in een DataFrame met de naam meat.
  • Zet de kolom date in meat om naar het type datetime.
  • Stel de kolom date in als de index van meat.
  • Print de samenvattende statistieken van alle numerieke kolommen in meat.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Read in meat DataFrame
meat = ____.____(____)

# Review the first five lines of the meat DataFrame
print(meat.head(5))

# Convert the date column to a datestamp type
meat['date'] = ____(____)

# Set the date column as the index of your DataFrame meat
meat = ____.____(____)

# Print the summary statistics of the DataFrame
print(meat.____)
Code bewerken en uitvoeren