1. 学ぶ
  2. /
  3. コース
  4. /
  5. pandas で学ぶデータ結合

Connected

演習

外部結合で俳優を抽出する

外部結合の良いところは、両方のテーブルのすべての行を返し、一致しない部分には null を入れるため、もう一方のテーブルに対応する行がないデータを見つけられる点です。ここでは、自分で試せるように、人気映画の Iron Man 1 と Iron Man 2 に出演した俳優の一覧が入った2つのテーブルを用意しました。多くの俳優は両方の作品に出演しています。外部結合を使って、両方の映画に出演して「いない」俳優を見つけましょう。

Iron Man 1 のテーブルは iron_1_actors、Iron Man 2 のテーブルは iron_2_actors です。どちらのテーブルも読み込まれており、構造がわかるように先頭の数行が表示されています。

Venn graph with no overlap

指示

100 XP
  • iron_1_actors(左)と iron_2_actors テーブルを、id 列で外部結合してマージし、サフィックスを ('_1','_2') に設定して、結果を iron_1_and_2 に保存します。
  • name_1 または name_2 が null のとき True、それ以外は False を返すインデックスを作成します。