1. 학습
  2. /
  3. 강의
  4. /
  5. R의 caret로 배우는 Machine Learning

Connected

연습 문제

전처리 방법 결합하기

train()의 preProcess 인자는 결측값 대치에만 국한되지 않습니다. 데이터 과학자의 작업을 훨씬 수월하게 해 주는 다양한 preProcess 기법을 포함하고 있어요. 전체 목록은 ?preProcess를 입력해 이 함수의 도움말 페이지에서 확인하실 수 있습니다.

회귀 모델을 학습할 때 특히 유용한 전처리 기법 중 하나가 표준화입니다. 즉, 중심화(centering)와 스케일링(scaling)인데요. 먼저 각 열의 평균을 해당 열의 모든 값에서 빼서 중심화하고, 이후 표준편차로 나누어 스케일링합니다.

표준화를 거치면 각 열의 평균은 0, 표준편차는 1이 됩니다. 이렇게 하면 회귀 모델이 더 안정적으로 좋은 해를 찾는 데 도움이 됩니다.

지침 1/2

undefined XP
  • 1

    작업 공간에 breast_cancer_x와 breast_cancer_y가 로드되어 있습니다. 중앙값 대치를 사용해 유방암 데이터에 로지스틱 회귀 모델 model을 적합하고, 콘솔에 출력하세요.

  • 2

    모델에 전처리 단계를 두 가지 더 추가하세요: 중심화와 스케일링.