1. Apprendre
  2. /
  3. Cours
  4. /
  5. Assembler des données avec pandas

Connected

Exercice

Jointure auto-référencée

Fusionner une table avec elle-même est utile lorsque vous voulez comparer les valeurs d'une colonne à d'autres valeurs de cette même colonne. Dans cet exercice, vous allez pratiquer cela en créant une table qui, pour chaque film, affiche sur une seule ligne le ou la réalisatrice et un membre de l'équipe. On vous fournit une table nommée crews, qui contient les colonnes id, job et name. Commencez par fusionner la table avec elle-même à l'aide de l'identifiant du film. Cette fusion produira une table plus grande où, pour chaque film, chaque poste est mis en correspondance avec tous les autres. Sélectionnez ensuite uniquement les lignes où la table de gauche contient un réalisateur et évitez d'avoir une ligne où le poste de réalisateur apparaît à la fois dans les tables de gauche et de droite. Ce filtrage retirera les combinaisons de postes qui ne sont pas avec le réalisateur.

La table crews a été chargée pour vous.

Instructions 1/3

undefined XP
    1
    2
    3
  • Dans une variable appelée crews_self_merged, fusionnez la table crews avec elle-même sur la colonne id au moyen d'une jointure interne, en définissant les suffixes '_dir' et '_crew' pour les tables gauche et droite respectivement.