1. Lära sig
  2. /
  3. Courses
  4. /
  5. PySpark 입문

Connected

exercise

CSV 읽기와 집계 수행

소규모부터 대규모까지 다양한 규모의 회사에서 일하는 Data Scientist의 급여 스프레드시트가 있습니다. 회사 규모별 평균 급여에 큰 차이가 있는지 확인해 보려고 합니다.

작업 공간에는 이미 SparkSession인 spark가 준비되어 있다는 점을 기억하세요!

Instruktioner

100 XP
  • CSV 파일을 DataFrame으로 로드하고 스키마를 자동 추론하세요.
  • 행의 총개수를 반환하세요.
  • company_size 열로 그룹화하고 salary_in_usd로 평균 급여를 계산하세요.