1. 학습
  2. /
  3. 강의
  4. /
  5. R로 배우는 Feature Engineering

Connected

연습 문제

준비와 분할

이제 누락값을 포함해 목표 변수 Attrition과 관련된 30개 피처가 있는 1470개 인스턴스로 구성된 전체 attrition 데이터셋을 사용해 보겠습니다. 목표는 타깃을 예측하는 완전한 엔드 투 엔드 모델을 만드는 것입니다. 데이터셋은 이미 로드되어 있어요.

데이터를 준비하고 분할하는 것부터 시작해 보세요.

지침

100 XP
  • 모든 문자형 값을 factor로 변환하세요.
  • 학습/테스트 분할을 생성하세요.