1. 学ぶ
  2. /
  3. コース
  4. /
  5. pandas で学ぶデータ操作

Connected

演習

マルチレベルインデックスの設定

インデックスは複数の列から作成して、マルチレベルインデックス(階層型インデックス とも呼ばれます)にすることもできます。これにはトレードオフがあります。

利点は、マルチレベルインデックスを使うと入れ子になったカテゴリ変数を自然に考えられる点です。たとえば臨床試験では、対照群と処置群があり、各被験者はいずれかの群に属します。つまり、被験者は処置群の内側に入れ子になっていると言えます。同様に、気温データセットでは都市は国の中に位置するので、都市は国の内側に入れ子になっていると表現できます。

主な欠点は、インデックスを操作するコードが列を操作するコードと異なるため、2種類の文法を学び、データがどのように表現されているかを把握しておく必要があることです。

pandas は pd として読み込まれています。temperatures が利用可能です。

指示

100 XP
  • temperatures のインデックスを "country" 列と "city" 列に設定し、temperatures_ind に代入します。
  • 残す国/都市の組を2つ指定します: "Brazil"/"Rio De Janeiro" と "Pakistan"/"Lahore"。これを rows_to_keep に代入します。
  • .loc[] を使って rows_to_keep で temperatures_ind を印刷し、サブセット化します。