1. Apprendre
  2. /
  3. Cours
  4. /
  5. Вступ до PySpark

Connected

Exercice

Запуск SQL для DataFrame

DataFrame у PySpark можна легко обробляти за допомогою SQL-запитів. Метод .sql() у SparkSession дає змогу програмно виконувати SQL-запити й повертати результат як інший датафрейм. У цій вправі ви створите тимчасову таблицю з датафрейму, який ви раніше побудували, потім складете запит, щоб вибрати імена людей із тимчасової таблиці, і запишете результат у новий датафрейм.

Пам'ятайте: у вашому середовищі вже доступні SparkSession spark і датафрейм df.

Instructions

100 XP
  • Створіть тимчасову таблицю з назвою "people" з датафрейму df.
  • Складіть запит, щоб вибрати імена людей із тимчасової таблиці people.
  • Присвойте результат запиту Spark новому датафрейму з назвою people_df_names.
  • Виведіть перші 10 імен людей із датафрейму people_df_names.