1. Учиться
  2. /
  3. Courses
  4. /
  5. PySpark로 하는 Machine Learning

Connected

Exercise

열 결합하기

데이터 준비의 마지막 단계는 모든 예측 변수 열을 하나의 열로 통합하는 것입니다.

이전 몇 가지 연습에서의 모든 변경 사항을 반영한 업데이트된 flights 데이터에는 다음과 같은 예측 변수 열이 있습니다:

  • mon, dom, dow
  • carrier_idx (carrier에서 인덱싱된 값)
  • org_idx (org에서 인덱싱된 값)
  • km
  • depart
  • duration

참고: show() 메서드에 truncate=False 인수를 주면 출력에서 데이터가 생략되지 않습니다.

Инструкции

100 XP
  • 예측 변수를 결합할 클래스를 임포트하세요.
  • 예측 변수 열을 하나의 열로 병합할 수 있는 assembler 객체를 생성하세요.
  • assembler를 사용해 새로운 통합 열을 생성하세요.