Maak een tijdreeks van luchtkwaliteitsdata
In de video zag je hoe je omgaat met datums die niet in het juiste formaat staan en als string zijn aangeleverd, weergegeven als dtype object in pandas.
We hebben een gegevensset met luchtkwaliteitsdata (ozon, pm25 en koolmonoxide voor NYC, 2000–2017) klaargezet zodat je kunt oefenen met pd.to_datetime().
Deze oefening maakt deel uit van de cursus
Tijdreeksgegevens manipuleren in Python
Oefeninstructies
We hebben pandas al voor je geïmporteerd als pd en matplotlib.pyplot als plt, en de DataFrame met luchtkwaliteitsdata ingeladen in de variabele data.
- Inspecteer
datamet.info(). - Gebruik
pd.to_datetimeom decolumn'date'om te zetten naardtypedatetime64. - Stel de
column'date'in alsindex. - Controleer de wijzigingen door
dataopnieuw te inspecteren met.info(). - Plot
datametsubplots=True.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
data = pd.read_csv('nyc.csv')
# Inspect data
print(____)
# Convert the date column to datetime64
# Set date column as index
# Inspect data
print(____)
# Plot data