1. 学ぶ
  2. /
  3. コース
  4. /
  5. pandas によるデータの結合

Connected

演習

セミジョインの実行

ストリーミングサービスで最も多くの収益を生み出しているトラックの中には、テレビ番組由来のものや、音楽以外の音声コンテンツも含まれています。収益上位の明細を含む請求書テーブルと、ストリーミングサービス上の非音楽トラックのテーブルが用意されています。この演習では、セミジョインを使って、収益上位の非音楽トラックを抽出しましょう。

テーブル non_mus_tcks、top_invoices、genres はあらかじめ読み込まれています。

指示

100 XP
  • non_mus_tcks と top_invoices を tid をキーに内部結合し、結果を tracks_invoices として保存してください。
  • .isin() を使って、non_mus_tcks の中から tid が tid の tracks_invoices 列に含まれる行を抽出し、結果を top_tracks として保存してください。
  • top_tracks を gid でグループ化し、tid の行数を集計してください。結果を cnt_by_gid として保存してください。
  • cnt_by_gid と genres テーブルを gid で結合し、結果を表示してください。