1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Joining Data with pandas

Connected

cvičení

Self join

Spojení tabulky se sebou samotnou se hodí, když chceš porovnávat hodnoty v jednom sloupci s ostatními hodnotami ve stejném sloupci. V tomto cvičení si to procvičíš tak, že vytvoříš tabulku, kde bude pro každý film na jednom řádku uveden režisér a člen štábu. Dostaneš tabulku crews se sloupci id, job a name. Nejprve tabulku spoj se sebou samotnou pomocí ID filmu. Tímto spojením získáš větší tabulku, kde je pro každý film každá pracovní pozice spárována s každou jinou. Pak vyber pouze řádky, kde je v levé tabulce režisér, a vynech řádky, kde se pozice režiséra objevuje zároveň v levé i pravé tabulce. Toto filtrování odstraní kombinace pozic, které nesouvisejí s režisérem.

Tabulka crews je už načtená.

Pokyny 1/3

undefined XP
    1
    2
    3
  • Do proměnné crews_self_merged spoj tabulku crews se sebou samotnou přes sloupec id pomocí inner joinu a nastav přípony na '_dir' pro levou a '_crew' pro pravou tabulku.