1. Learn
  2. /
  3. Курси
  4. /
  5. Вступ до PySpark

Connected

вправа

Запити до тимчасового подання

У цій вправі ви потренуєтеся реєструвати датафрейм як тимчасове подання SQL у PySpark. Тимчасові подання — це потужний інструмент, що дає змогу виконувати запити до даних за допомогою синтаксису SQL, спрощуючи складні перетворення та роблячи їх інтуїтивнішими. Ваше завдання — створити подання з наданого датафрейму та виконати по ньому SQL-запити — типова дія для ETL та ELT.

У вашому середовищі вже доступні SparkContext spark і датафрейм PySpark df.

Інструкції

100 XP
  • Зареєструйте нове подання з назвою "data_view" з датафрейму df.
  • Запустіть наданий SQL-запит, щоб обчислити загальну зарплату за посадою.