1. Learn
  2. /
  3. Courses
  4. /
  5. 使用 pandas 连接数据

Connected

Exercise

自连接(Self join)

当您想把某一列中的取值彼此比较时,将一张表与自身合并会很有用。在本练习中,您将通过创建一张表来实践这一点:对于每部电影,用一行同时列出该电影的导演和一位剧组成员。您已获得名为 crews 的表,其中包含 id、job 和 name 三列。首先,按电影 ID 将这张表与自身合并。这样会得到一张更大的表,其中每部电影的每个岗位都会与其他岗位配对。然后,只选择左表中岗位为导演的行,并避免出现导演的岗位同时出现在左右两表的行。这样的筛选会去除不涉及导演的岗位组合。

crews 表已为您加载。

Instructions 1/3

undefined XP
    1
    2
    3
  • 将 crews 表按 id 列使用内连接与自身合并到名为 crews_self_merged 的变量中,并将左右表的后缀分别设置为 '_dir' 和 '_crew'。