1. 학습
  2. /
  3. 강의
  4. /
  5. R에서 tidymodels로 모델링하기

Connected

연습 문제

Feature engineering 과정

Feature engineering을 모델링 과정에 포함하려면, 모델 적합 단계 전에 학습용과 테스트용 데이터셋을 전처리해야 해요. 이번 챕터에서 배운 내용을 활용하면, 통신 데이터의 모든 사용 가능한 예측 변수를 사용해 로지스틱 회귀 모델을 학습할 수 있어요.

이 연습 문제에서는 통신 데이터에 대해 feature engineering 파이프라인을 만들고, 이를 사용해 학습용과 테스트용 데이터셋을 변환해 보겠습니다.

telecom_training과 telecom_test 데이터셋, 그리고 로지스틱 회귀 모델 사양인 logistic_model이 세션에 로드되어 있어요.

지침 1/3

undefined XP
    1
    2
    3
  • recipe 객체 telecom_recipe를 만들어서, 종속 변수를 canceled_service로 설정하고 telecom_training의 나머지 모든 열을 예측 변수로 지정하세요.
  • 셀렉터 함수를 사용해 상관 계수 임계값 0.8에서 상관된 예측 변수를 제거하고, 모든 수치형 예측 변수에 로그 변환을 적용한 뒤, 모든 수치형 예측 변수를 정규화하고, 모든 명목형 예측 변수에 대해 더미 변수를 생성하세요.