1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Foundations of PySpark

Connected

Cvičení

Spoj DataFrames

V následujících dvou kapitolách budeš budovat model, který předpovídá, jestli let bude zpožděný nebo ne – a to na základě dat o letech, se kterými jsme dosud pracovali. Model bude zahrnovat i informace o letadle, které danou trasu letělo. Prvním krokem je proto spojení dvou tabulek: flights a planes!

Pokyny

100 XP
  • Nejprve přejmenuj sloupec year v tabulce planes na plane_year, aby nedošlo ke konfliktům s duplicitními názvy sloupců.
  • Vytvoř nový DataFrame s názvem model_data spojením tabulky flights s tabulkou planes pomocí sloupce tailnum jako klíče.