1. Learn
  2. /
  3. Курси
  4. /
  5. Вступ до PySpark

Connected

вправа

Створення RDD

У PySpark ви можете створити RDD (Resilient Distributed Dataset — надійний розподілений набір даних) кількома способами. Оскільки ви вже знайомі з датафреймами, налаштуймо це через датафрейм. Памʼятайте: у вашому робочому середовищі вже є SparkSession з назвою spark!

Інструкції

100 XP
  • Створіть датафрейм з наданого списку під назвою df.
  • Перетворіть датафрейм на RDD.
  • Зберіть і виведіть отриманий RDD.