CommencerCommencer gratuitement

Utilisation d'une jointure externe pour sélectionner des acteurs

Un aspect intéressant de l'utilisation d'une jointure externe est que, comme elle renvoie toutes les lignes des deux tables fusionnées et null lorsqu'elles ne correspondent pas, vous pouvez l'utiliser pour trouver des lignes qui n'ont pas de correspondance dans l'autre table. Pour tester par vous-même, vous avez reçu deux tables contenant une liste d'acteurs de deux films populaires : Iron Man 1 et Iron Man 2. La plupart des acteurs ont joué dans les deux films. Utilisez une jointure externe pour trouver les acteurs qui n'ont pas joué dans les deux films.

La table Iron Man 1 s'appelle iron_1_actors, et la table Iron Man 2 s'appelle iron_2_actors. Les deux tables ont été chargées pour vous et quelques lignes ont été affichées pour que vous puissiez voir la structure.

Graphique de Venn sans chevauchement

Cet exercice fait partie du cours

Joindre des données avec pandas

Afficher le cours

Instructions

  • Enregistrez dans iron_1_and_2 la fusion des tables iron_1_actors (gauche) et iron_2_actors avec une jointure externe sur la colonne id, et définissez les suffixes sur ('_1','_2').
  • Créez un index qui renvoie True si name_1 ou name_2 sont nuls, et False dans le cas contraire.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Merge iron_1_actors to iron_2_actors on id with outer join using suffixes
iron_1_and_2 = iron_1_actors.merge(____,
                                     ____,
                                     ____,
                                     suffixes=____)

# Create an index that returns true if name_1 or name_2 are null
m = ((iron_1_and_2['name_1'].____) | 
     (iron_1_and_2['____'].____))

# Print the first few rows of iron_1_and_2
print(iron_1_and_2[m].head())
Modifier et exécuter le code