1. 학습
  2. /
  3. 강의
  4. /
  5. PySpark 입문

Connected

연습 문제

스키마 추론과 필터링

헤더와 스키마가 있는 인구 조사 데이터셋이 있다고 가정해 봅시다. 그 데이터셋을 로드하고 PySpark가 스키마를 추론하도록 해 보세요. 40세 이상의 성인을 필터링하면 무엇이 보이나요?

워크스페이스에는 이미 SparkSession인 spark가 준비되어 있다는 점을 기억하세요!

지침

100 XP
  • JSON 파일 adults.json을(를) 로드하세요.
  • age가 40을 넘는 성인만 포함하도록 데이터를 필터링하세요.
  • 결과를 표시하세요.