1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. pandas によるデータ操作

Connected

Bài tập

階層型インデックスの設定

インデックスは複数の列から作成することもでき、階層型インデックスを形成します。これを使うことにはメリットとデメリットがあります。

メリットは、階層型インデックスを使うと、入れ子構造を持つカテゴリ変数についてより自然に考えられることです。たとえば臨床試験では、対照群と処置群があるとします。その場合、各被験者はいずれかの群に属しており、被験者は処置群の中に入れ子構造として含まれると言えます。同様に、気温データセットでは都市が国に属しているため、都市は国の中に入れ子構造として含まれると言えます。

主なデメリットは、インデックスを操作するコードが列を操作するコードとは異なるため、2つの構文を学び、データがどの構造で表されているかを把握しておく必要があることです。

pandas は pd として読み込まれています。temperatures はすでに用意されています。

Hướng dẫn

100 XP
  • temperatures のインデックスを "country" 列と "city" 列に設定し、temperatures_ind に代入しましょう。
  • 残す国と都市のペアとして、"Brazil"/"Rio De Janeiro" と "Pakistan"/"Lahore" の2つを指定し、rows_to_keep に代入しましょう。
  • .loc[] を使って、rows_to_keep に対応する temperatures_ind の行をサブセット化し、出力しましょう。