1. 학습
  2. /
  3. 강의
  4. /
  5. PySpark로 하는 Machine Learning

Connected

연습 문제

범주형 열

flights 데이터에는 범주형 데이터를 담은 carrier와 org 두 열이 있어요. 이 열들을 인덱싱된 숫자 값으로 변환해야 합니다.

지침

100 XP
  • 적절한 클래스를 임포트하고 인덱서 객체를 만들어 carrier 열을 문자열에서 숫자 인덱스로 변환하세요.
  • flights 데이터에 대해 인덱서 객체를 준비하세요.
  • 준비한 인덱서를 사용해 숫자 인덱스 열을 생성하세요.
  • 같은 과정을 org 열에도 반복하세요.