1. Learn
  2. /
  3. Cursuri
  4. /
  5. Introducere în PySpark

Connected

exercițiu

Analiză cu SQL pe DataFrame-uri

Interogările SQL sunt concise și ușor de aplicat față de operațiunile pe DataFrame. Totuși, pentru a folosi interogări SQL pe un DataFrame, trebuie mai întâi să creezi o vedere temporară a acestuia ca tabel, după care poți aplica interogările SQL pe tabelul creat.

Ai deja un SparkContext spark și salaries_df disponibile în spațiul tău de lucru.

Instrucțiuni

100 XP
  • Creează tabelul temporar "salaries_table" din DataFrame-ul salaries_df.
  • Construiește o interogare pentru a extrage coloana "job_title" pentru locațiile din Canada ("CA").
  • Aplică interogarea SQL și creează un nou DataFrame numit canada_titles.
  • Obține un rezumat al tabelului.