1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Manipulace s daty v pandas

Connected

Cvičení

Nastavení víceúrovňových indexů

Index lze sestavit také z více sloupců – vznikne tak víceúrovňový index (někdy označovaný jako hierarchický index). Toto řešení má své výhody i nevýhody.

Výhodou je, že víceúrovňové indexy usnadňují práci s vnořenými kategoriálními proměnnými. Například v klinické studii můžeš mít kontrolní a experimentální skupiny – každý účastník patří do jedné z nich a je tak vnořen do příslušné skupiny. Podobně v datové sadě teplot leží město uvnitř země, takže město je vnořeno do země.

Hlavní nevýhodou je, že kód pro práci s indexy se liší od kódu pro práci se sloupci – musíš se tedy naučit dvě syntaxe a průběžně sledovat, jak jsou tvá data reprezentována.

pandas je načtený jako pd. K dispozici máš DataFrame temperatures.

Pokyny

100 XP
  • Nastav index temperatures na sloupce "country" a "city" a výsledek ulož do temperatures_ind.
  • Zadej dvě kombinace země/město, které chceš zachovat: "Brazil"/"Rio De Janeiro" a "Pakistan"/"Lahore", a ulož je do rows_to_keep.
  • Vypiš a vyfiltruj temperatures_ind pro rows_to_keep pomocí .loc[].