1. Обучение
  2. /
  3. Курса
  4. /
  5. Wprowadzenie do PySpark

Connected

упражнение

Definiowanie schematu

Wczytywaliśmy już schematy na różne sposoby. Teraz zdefiniujemy schemat bezpośrednio, korzystając ze słownika danych:

Zmienna Opis
age Wiek osoby
education_num Wykształcenie według stopnia
marital_status Stan cywilny
occupation Zawód
income Kategoryczny poziom dochodu

Инструкции

100 XP
  • Zdefiniuj schemat danych, podając nazwy kolumn (age, education_num, marital_status, occupation i income) oraz ich typy, a dla argumentu sep= ustaw przecinek.
  • Wczytaj dane z pliku z wartościami rozdzielanymi przecinkami o nazwie adult_reduced_100.csv.
  • Wyświetl schemat powstałego DataFrame.