Reflexiver Join
Das Verknüpfen einer Tabelle mit sich selbst kann nützlich sein, wenn du Werte in einer Spalte mit anderen Werten in derselben Spalte vergleichen willst. Dies kannst du jetzt üben, indem du eine Tabelle erstellst, die für jeden Film den Regisseur und ein Crewmitglied in einer Zeile auflistet. Du hast eine Tabelle namens crews
mit den Spalten id
, job
und name
erhalten. Verknüpfe zunächst die Tabelle anhand der Film-ID mit sich selbst. Durch diese Verknüpfung erhältst du eine größere Tabelle, in der für jeden Film jeder Job mit jedem anderen abgeglichen wird. Wähle dann nur die Zeilen aus, die einen Regisseur in der linken Tabelle haben, und sorge dafür, dass auf keiner Zeile der Job des Regisseurs sowohl in der linken als auch in der rechten Tabelle aufgeführt ist. Durch diese Filterung werden Kombinationen aus Jobs entfernt, die keinen Regisseur enthalten.
Die Tabelle crews
wurde für dich geladen.
Diese Übung ist Teil des Kurses
Daten mit pandas verknüpfen
Interaktive Übung zum Anfassen
Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.
# Merge the crews table to itself
crews_self_merged = ____