1. 学ぶ
  2. /
  3. コース
  4. /
  5. R에서 tidymodels로 모델링하기

Connected

演習

recipes로 상관된 예측 변수를 제거하기

학습 및 테스트 데이터셋에서 상관된 예측 변수를 제거하는 것은 모델 적합이 최대한 원활하게 진행되도록 하는 중요한 특징 공학 단계예요.

이제 monthly_charges와 avg_data_gb가 높은 상관을 보인다는 것을 확인했으니, 통신 데이터에 대한 특징 공학 파이프라인에 step_corr()로 상관 필터를 추가해야 합니다.

이번 연습에서는 통신 데이터에서 상관된 예측 변수를 제거하는 recipe 객체를 만들어 볼게요.

telecom_training과 telecom_test 데이터셋은 세션에 이미 로드되어 있어요.

指示1 / 4

undefined XP
    1
    2
    3
    4
  • telecom_training에서 결과 변수를 canceled_service로, 나머지 모든 열을 예측 변수로 설정하는 recipe 객체 telecom_cor_rec을(를) 만드세요.
  • all_numeric() 선택자 함수와 상관 계수 임계값 0.8을 사용해 높은 상관의 예측 변수를 제거하는 전처리 단계를 추가하세요.