1. Uczyć się
  2. /
  3. Courses
  4. /
  5. PySpark 입문

Connected

Exercise

스키마 작성

이제까지 여러 방법으로 스키마를 불러왔죠. 이번에는 스키마를 직접 정의해 보겠습니다. 다음의 데이터 사전을 사용할게요:

Variable Description
age 개인의 나이
education_num 학력(학위 수준)
marital_status 혼인 상태
occupation 직업
income 소득 범주형 변수

Instrukcje

100 XP
  • 데이터 스키마를 지정하세요. 열 이름은 (age,education_num,marital_status,occupation,income)이고, 각 열의 타입을 설정하세요. 파일 구분자는 sep= 인자에 쉼표로 지정합니다.
  • adult_reduced_100.csv라는 쉼표로 구분된 파일에서 데이터를 읽어오세요.
  • 생성된 DataFrame의 스키마를 출력하세요.