1. Learn
  2. /
  3. Cursuri
  4. /
  5. Introducere în PySpark

Connected

exercițiu

Încărcarea datelor de recensământ

Hai să creăm primul tău DataFrame PySpark! Fișierul adult_reduced.csv conține o grupare de adulți în funcție de diverse categorii demografice. Datele au fost adaptate din recensământul SUA și includ un total de 32.562 de grupări de adulți.

Vom încărca fișierul CSV și vom examina schema rezultată.

Dicționar de date:

Variabilă Descriere
age Vârsta persoanei
education_num Nivelul de educație
marital_status Starea civilă
occupation Ocupația
income Venitul (categoric)

Instrucțiuni

100 XP
  • Creează un DataFrame PySpark din fișierul "adult_reduced.csv" folosind metoda spark.read.csv().
  • Afișează DataFrame-ul rezultat.