1. Learn
  2. /
  3. Курси
  4. /
  5. Introduction to PySpark

Connected

вправа

Analytika pomocí SQL nad DataFrame

SQL dotazy jsou oproti operacím s DataFrame stručné a snadno použitelné. Aby bylo možné SQL dotazy na DataFrame spustit, je nejprve potřeba vytvořit dočasný pohled DataFrame jako tabulku a teprve pak na ní dotazy aplikovat.

V prostředí máš k dispozici SparkContext spark a DataFrame salaries_df.

Інструкції

100 XP
  • Z DataFrame salaries_df vytvoř dočasnou tabulku "salaries_table".
  • Sestav dotaz, který z company_location v Kanadě ("CA") extrahuje sloupec "job_title".
  • Aplikuj SQL dotaz a vytvoř nový DataFrame canada_titles.
  • Získej souhrn tabulky.