1. Uczyć się
  2. /
  3. Courses
  4. /
  5. Manipulacja danymi z pandas

Connected

Exercise

Tworzenie indeksów wielopoziomowych

Indeksy można też tworzyć z wielu kolumn – tworząc indeks wielopoziomowy (nazywany czasem indeksem hierarchicznym). Rozwiązanie to ma swoje zalety i wady.

Zaleta jest taka, że indeksy wielopoziomowe ułatwiają pracę z zagnieżdżonymi zmiennymi kategorycznymi. Na przykład w badaniu klinicznym możesz mieć grupy kontrolne i grupy poddane leczeniu. Każdy uczestnik badania należy do jednej z grup – mówimy wtedy, że uczestnik jest zagnieżdżony wewnątrz grupy. Podobnie w zbiorze danych o temperaturach: miasto leży w danym kraju, czyli można powiedzieć, że miasto jest zagnieżdżone wewnątrz kraju.

Główną wadą jest to, że kod do pracy z indeksami różni się od kodu do pracy z kolumnami – trzeba zatem poznać dwie składnie i pilnować, w jaki sposób dane są reprezentowane.

pandas jest załadowany jako pd. Dostępny jest DataFrame temperatures.

Instrukcje

100 XP
  • Ustaw indeks temperatures na kolumny "country" i "city", a wynik przypisz do temperatures_ind.
  • Podaj dwie pary kraj/miasto do zachowania: "Brazil"/"Rio De Janeiro" oraz "Pakistan"/"Lahore", przypisując je do rows_to_keep.
  • Wyświetl i przefiltruj temperatures_ind dla rows_to_keep przy użyciu .loc[].