Découpage de séries temporelles
Le découpage est particulièrement utile pour les séries chronologiques, car il est courant de vouloir filtrer les données comprises dans une plage de dates. Ajoutez la colonne date
à l'index, puis utilisez .loc[]
pour créer le sous-ensemble. L'important est de conserver les dates au format ISO 8601, c'est-à-dire "yyyy-mm-dd"
pour année-mois-jour, "yyyy-mm"
pour année-mois et "yyyy"
pour année.
Rappelez-vous que vous avez vu au chapitre 1 que vous pouvez combiner plusieurs conditions booléennes à l'aide d'opérateurs logiques, tels que &
. Pour y parvenir en une seule ligne de code, vous devez ajouter des parenthèses ()
autour de chaque condition.
pandas
est chargé en tant que pd
et temperatures
, sans index, est disponible.
Cet exercice fait partie du cours
Manipulation de données avec pandas
Instructions
- Utilisez les conditions booléennes, pas
.isin()
ou.loc[]
, et la date complète"yyyy-mm-dd"
, pour soustrairetemperatures
des lignes dont la colonnedate
est en 2010 et 2011 et affichez les résultats. - Attribuez l'index de
temperatures
à la colonnedate
et triez-la. - Utilisez
.loc[]
pour créer un sous-ensembletemperatures_ind
pour les lignes en 2010 et 2011. - Utilisez
.loc[]
pour sous-sélectionnertemperatures_ind
pour les lignes allant de August 2010 à February 2011.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Use Boolean conditions to subset temperatures for rows in 2010 and 2011
temperatures_bool = ____[(____ >= ____) & (____ <= ____)]
print(temperatures_bool)
# Set date as the index and sort the index
temperatures_ind = temperatures.____.____
# Use .loc[] to subset temperatures_ind for rows in 2010 and 2011
print(____)
# Use .loc[] to subset temperatures_ind for rows from Aug 2010 to Feb 2011
print(____)