1. Learn
  2. /
  3. Курси
  4. /
  5. Вступ до PySpark

Connected

вправа

Визначення та фільтрація

Уявіть, що у вас є набір даних перепису населення з заголовком і схемою. Завантажмо цей набір і дозвольмо PySpark визначити схему автоматично. Що ви побачите, якщо відфільтруєте дорослих старших за 40 років?

Пам'ятайте: у вашому робочому середовищі вже є SparkSession під назвою spark!

Інструкції

100 XP
  • Завантажте JSON-файл adults.json.
  • Відфільтруйте дані, щоб залишити дорослих зі значенням age понад 40.
  • Показати результати.