CommencerCommencer gratuitement

Découpage de séries temporelles

Le découpage est particulièrement utile pour les séries chronologiques, car il est courant de vouloir filtrer les données comprises dans une plage de dates. Ajoutez la colonne date à l'index, puis utilisez .loc[] pour créer le sous-ensemble. L'important est de conserver les dates au format ISO 8601, c'est-à-dire "yyyy-mm-dd" pour année-mois-jour, "yyyy-mm" pour année-mois et "yyyy" pour année.

Rappelez-vous que vous avez vu au chapitre 1 que vous pouvez combiner plusieurs conditions booléennes à l'aide d'opérateurs logiques, tels que &. Pour y parvenir en une seule ligne de code, vous devez ajouter des parenthèses () autour de chaque condition.

pandas est chargé en tant que pd et temperatures, sans index, est disponible.

Cet exercice fait partie du cours

Manipulation de données avec pandas

Afficher le cours

Instructions

  • Utilisez les conditions booléennes, pas .isin() ou .loc[], et la date complète "yyyy-mm-dd", pour soustraire temperatures des lignes dont la colonne date est en 2010 et 2011 et affichez les résultats.
  • Attribuez l'index de temperatures à la colonne date et triez-la.
  • Utilisez .loc[] pour créer un sous-ensemble temperatures_ind pour les lignes en 2010 et 2011.
  • Utilisez .loc[] pour sous-sélectionner temperatures_ind pour les lignes allant de August 2010 à February 2011.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Use Boolean conditions to subset temperatures for rows in 2010 and 2011
temperatures_bool = ____[(____ >= ____) & (____ <= ____)]
print(temperatures_bool)

# Set date as the index and sort the index
temperatures_ind = temperatures.____.____

# Use .loc[] to subset temperatures_ind for rows in 2010 and 2011
print(____)

# Use .loc[] to subset temperatures_ind for rows from Aug 2010 to Feb 2011
print(____)
Modifier et exécuter le code