1. 학습
  2. /
  3. 강의
  4. /
  5. R에서 tidymodels로 모델링하기

Connected

연습 문제

완전한 Feature Engineering 파이프라인

recipes 패키지는 여러 Feature Engineering 단계를 하나의 객체에 담아, Machine Learning 워크플로에서 데이터 변환을 더 쉽게 관리할 수 있도록 설계되었습니다.

이번 연습에서는 통신 데이터(telecommunications data)를 모델링에 적합하도록 준비하기 위해 Feature Engineering 파이프라인을 학습해 보겠습니다.

이전 연습에서 사용한 telecom_df 티블과 telecom_training, telecom_test 데이터셋이 워크스페이스에 로드되어 있습니다.

지침

100 XP
  • 학습 데이터의 모든 예측 변수를 사용해 canceled_service를 예측하는 레시피를 만드세요.
  • 임계값 0.8을 사용하여 상관된 예측 변수를 제거하세요.
  • 모든 숫자형 예측 변수를 정규화하세요.
  • 모든 명목형 예측 변수에 대해 더미 변수를 만드세요.
  • 레시피를 학습 데이터로 학습한 뒤, 테스트 데이터에 적용하세요.