Met een outer join acteurs selecteren
Een handig voordeel van een outer join is dat je, omdat alle rijen uit beide samengevoegde tabellen worden teruggegeven en null waar er geen match is, kunt zoeken naar rijen die géén match hebben in de andere tabel. Om dit zelf te proberen, krijg je twee tabellen met lijsten van acteurs uit twee populaire films: Iron Man 1 en Iron Man 2. De meeste acteurs speelden in beide films. Gebruik een outer join om acteurs te vinden die niet in beide films speelden.
De tabel voor Iron Man 1 heet iron_1_actors, en de tabel voor Iron Man 2 heet iron_2_actors. Beide tabellen zijn voor je ingeladen en er zijn een paar rijen afgedrukt zodat je de structuur kunt zien.

Deze oefening maakt deel uit van de cursus
Data samenvoegen met pandas
Oefeninstructies
- Sla in
iron_1_and_2de merge op van de tabelleniron_1_actors(links) eniron_2_actorsmet een outer join op de kolomid, en zet de achtervoegsels op('_1','_2'). - Maak een index die
Trueteruggeeft alsname_1ofname_2null is, en andersFalse.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Merge iron_1_actors to iron_2_actors on id with outer join using suffixes
iron_1_and_2 = iron_1_actors.merge(____,
____,
____,
suffixes=____)
# Create an index that returns true if name_1 or name_2 are null
m = ((iron_1_and_2['name_1'].____) |
(iron_1_and_2['____'].____))
# Print the first few rows of iron_1_and_2
print(iron_1_and_2[m].head())