1. Learn
  2. /
  3. 课程
  4. /
  5. 使用 pandas 连接数据

Connected

道练习

执行半连接(semi join)

收入最高的一些曲目来自电视节目或其他非音乐音频。您拿到了一张包含高收入条目的发票表。同时,还有一张来自流媒体服务的非音乐曲目表。在本练习中,您将使用半连接来找出带来最高收入的非音乐曲目。

表 non_mus_tcks、top_invoices 和 genres 已为您加载。

说明

100 XP
  • 使用内连接在 tid 上合并 non_mus_tcks 和 top_invoices。将结果保存为 tracks_invoices。
  • 使用 .isin() 筛选 non_mus_tcks 中那些 tid 出现在 tracks_invoices 的 tid 列中的行。将结果保存为 top_tracks。
  • 按 gid 对 top_tracks 分组,并统计 tid 的行数。将结果保存到 cnt_by_gid。
  • 将 cnt_by_gid 与 genres 表在 gid 上合并,并打印结果。