1. 学习
  2. /
  3. 课程
  4. /
  5. PySpark로 데이터 정제하기

Connected

练习

스키마 정의하기

명시적인 스키마를 만들면 데이터 품질과 가져오기 성능이 향상돼요. 강의에서 언급했듯이, 다음 열을 읽기 위한 간단한 스키마를 만들어 보겠습니다.

  • Name
  • Age
  • City

Name과 City 열은 StringType()이고, Age 열은 IntegerType()입니다.

说明

100 XP
  • pyspark.sql.types 라이브러리에서 *를 import 하세요.
  • StructType 메서드를 사용해 새 스키마를 정의하세요.
  • name, age, city에 대한 StructField를 정의하세요. 각 필드는 올바른 데이터 타입에 대응하고 nullable이 아니어야 합니다.