Créer une série temporelle de données de qualité de l’air
Vous avez vu dans la vidéo comment gérer des dates qui ne sont pas au bon format et sont fournies comme types string, représentées comme dtype object dans pandas.
Nous avons préparé un jeu de données sur la qualité de l’air (ozone, pm25 et monoxyde de carbone pour NYC, 2000-2017) afin que vous puissiez vous entraîner à utiliser pd.to_datetime().
Cet exercice fait partie du cours
Manipuler des séries temporelles en Python
Instructions
Nous avons déjà importé pandas sous le nom pd et matplotlib.pyplot sous le nom plt pour vous, et chargé le DataFrame de qualité de l’air dans la variable data.
- Inspectez
dataavec.info(). - Utilisez
pd.to_datetimepour convertir lacolumn'date'endtypedatetime64. - Définissez la
column'date'commeindex. - Validez les modifications en inspectant à nouveau
dataavec.info(). - Tracez
dataen utilisantsubplots=True.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
data = pd.read_csv('nyc.csv')
# Inspect data
print(____)
# Convert the date column to datetime64
# Set date column as index
# Inspect data
print(____)
# Plot data