Erste SchritteKostenlos loslegen

Äußerer Join zur Auswahl von Schauspielern

Ein cooler Aspekt von äußeren Joins ist, dass du damit Zeilen finden kannst, die in der jeweils anderen Tabelle nicht übereinstimmen. Denn der Join liefert ja alle Zeilen aus den beiden verknüpften Tabellen und gibt dabei einen Nullwert aus, wenn sie nicht übereinstimmen. Um es selbst auszuprobieren, hast du zwei Tabellen mit einer Liste von Schauspielern aus zwei bekannten Filmen erhalten: Iron Man 1 und Iron Man 2. Der Großteil der Besetzung hat in beiden Filmen mitgespielt. Verwende einen äußeren Join, um die Schauspieler zu finden, die nicht in beiden Filmen mitgespielt haben.

Die Tabelle für Iron Man 1 heißt iron_1_actors und die für Iron Man 2 heißt iron_2_actors. Es wurden bereits beide Tabellen für dich geladen und ein paar Zeilen ausgegeben, damit du die Struktur sehen kannst.

Venn-Diagramm ohne Überlappung

Diese Übung ist Teil des Kurses

Daten mit pandas verknüpfen

Kurs anzeigen

Anleitung zur Übung

  • Verknüpfe die Tabelle iron_1_actors (links) mit iron_2_actors durch einen äußeren Join anhand der Spalte id und setze die Suffixe auf ('_1','_2'). Speichere dies als iron_1_and_2.
  • Erstelle einen Index, der True zurückgibt, wenn name_1 oder name_2 null ist, und ansonsten False.

Interaktive Übung zum Anfassen

Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.

# Merge iron_1_actors to iron_2_actors on id with outer join using suffixes
iron_1_and_2 = iron_1_actors.merge(____,
                                     ____,
                                     ____,
                                     suffixes=____)

# Create an index that returns true if name_1 or name_2 are null
m = ((iron_1_and_2['name_1'].____) | 
     (iron_1_and_2['____'].____))

# Print the first few rows of iron_1_and_2
print(iron_1_and_2[m].head())
Bearbeiten und Ausführen von Code