Aan de slagGa gratis aan de slag

Met een outer join acteurs selecteren

Een handig voordeel van een outer join is dat je, omdat alle rijen uit beide samengevoegde tabellen worden teruggegeven en null waar er geen match is, kunt zoeken naar rijen die géén match hebben in de andere tabel. Om dit zelf te proberen, krijg je twee tabellen met lijsten van acteurs uit twee populaire films: Iron Man 1 en Iron Man 2. De meeste acteurs speelden in beide films. Gebruik een outer join om acteurs te vinden die niet in beide films speelden.

De tabel voor Iron Man 1 heet iron_1_actors, en de tabel voor Iron Man 2 heet iron_2_actors. Beide tabellen zijn voor je ingeladen en er zijn een paar rijen afgedrukt zodat je de structuur kunt zien.

Venn graph with no overlap

Deze oefening maakt deel uit van de cursus

Data samenvoegen met pandas

Cursus bekijken

Oefeninstructies

  • Sla in iron_1_and_2 de merge op van de tabellen iron_1_actors (links) en iron_2_actors met een outer join op de kolom id, en zet de achtervoegsels op ('_1','_2').
  • Maak een index die True teruggeeft als name_1 of name_2 null is, en anders False.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Merge iron_1_actors to iron_2_actors on id with outer join using suffixes
iron_1_and_2 = iron_1_actors.merge(____,
                                     ____,
                                     ____,
                                     suffixes=____)

# Create an index that returns true if name_1 or name_2 are null
m = ((iron_1_and_2['name_1'].____) | 
     (iron_1_and_2['____'].____))

# Print the first few rows of iron_1_and_2
print(iron_1_and_2[m].head())
Code bewerken en uitvoeren