1. Nauka
  2. /
  3. Kursy
  4. /
  5. Manipulation de données avec pandas

Connected

ćwiczenie

Définir des index à plusieurs niveaux

Des index peuvent aussi être créés à partir de plusieurs colonnes, formant un index à plusieurs niveaux (parfois appelé index hiérarchique). Il y a un compromis à faire en les utilisant.

L'avantage, c'est que les index à plusieurs niveaux facilitent le raisonnement sur des variables catégorielles imbriquées. Par exemple, dans un essai clinique, vous pourriez avoir des groupes témoin et traitement. Chaque sujet appartient à l'un ou l'autre groupe; on peut donc dire qu'un sujet est imbriqué dans le groupe de traitement. De même, dans l'ensemble de données de températures, la ville se trouve dans un pays; on peut donc dire qu'une ville est imbriquée dans le pays.

Le principal inconvénient, c'est que le code pour manipuler les index diffère de celui pour manipuler les colonnes. Vous devez donc apprendre deux syntaxes et garder en tête la représentation de vos données.

pandas est importé sous le nom pd. temperatures est disponible.

Instrukcje

100 XP
  • Définissez l'index de temperatures avec les colonnes "country" et "city", et assignez-le à temperatures_ind.
  • Indiquez deux paires pays/ville à conserver : "Brazil"/"Rio De Janeiro" et "Pakistan"/"Lahore", et assignez-les à rows_to_keep.
  • Affichez et sous-ensembliez temperatures_ind pour rows_to_keep à l'aide de .loc[].