1. Learn
  2. /
  3. Курси
  4. /
  5. Вступ до PySpark

Connected

вправа

Аналітика з SQL на датафреймах

SQL-запити зазвичай лаконічні та простіші у виконанні, ніж операції з датафреймами. Але щоб застосувати SQL до датафрейму, спершу потрібно створити його тимчасове подання як таблиці, а вже потім виконувати SQL-запити до створеної таблиці.

У вашому середовищі вже доступні SparkContext spark і датафрейм salaries_df.

Інструкції

100 XP
  • Створіть тимчасову таблицю "salaries_table" з датафрейму salaries_df.
  • Складіть запит, щоб вибрати стовпець "job_title" для company_location у Канаді ("CA").
  • Застосуйте SQL-запит і створіть новий датафрейм canada_titles.
  • Отримайте зведену статистику таблиці.