1. Learn
  2. /
  3. Курси
  4. /
  5. Вступ до PySpark

Connected

вправа

Завантаження даних перепису

Почнімо створювати ваш перший датафрейм у PySpark! Файл adult_reduced.csv містить групування дорослих за різними демографічними категоріями. Ці дані адаптовано з перепису населення США. Загалом є 32 562 групування дорослих.

Завантажмо CSV і перегляньмо отриману схему.

Словник даних:

Змінна Опис
age Вік особи
education_num Освіта за ступенем
marital_status Сімейний стан
occupation Рід занять
income Категоріальний дохід

Інструкції

100 XP
  • Створіть датафрейм PySpark з файлу "adult_reduced.csv", використавши метод spark.read.csv().
  • Відобразіть отриманий датафрейм.