1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Introduction to PySpark

Connected

cvičení

Zápis schématu

Schémata jsme už načítali různými způsoby. Teď si jedno definujeme přímo. Použijeme datový slovník:

Proměnná Popis
age Věk osoby
education_num Vzdělání podle stupně
marital_status Rodinný stav
occupation Povolání
income Kategorický příjem

Pokyny

100 XP
  • Definuj schéma dat – zadej názvy sloupců (age, education_num, marital_status, occupation a income) a jejich datové typy; jako argument sep= nastav čárku.
  • Načti data z čárkami odděleného souboru adult_reduced_100.csv.
  • Vypiš schéma výsledného DataFrame.