1. 학습
  2. /
  3. 강의
  4. /
  5. R에서 tidymodels로 모델링하기

Connected

연습 문제

상관된 예측 변수 찾아보기

상관된 예측 변수는 중복 정보를 제공하며 모델 적합 과정에 부정적인 영향을 줄 수 있어요. 두 변수가 높게 상관되어 있으면 값이 서로 선형적으로 함께 변하고, 결국 머신 러닝 알고리즘에 같은 정보를 제공하게 됩니다. 이 현상을 다중공선성이라고 해요.

모델을 적합하기 전에, 데이터셋에서 이런 관계를 탐색해 찾아내고, 피처 엔지니어링 단계에서 제거하는 것이 중요합니다.

이 연습 문제에서는 telecom_training 데이터셋의 모든 수치형 예측 변수로 상관관계 행렬을 만들어 탐색해 보겠습니다.

telecom_training 데이터는 이미 세션에 로드되어 있어요.

지침 1/3

undefined XP
    1
    2
    3
  • telecom_training 데이터에서 모든 수치형 열을 선택하세요.
  • 선택한 수치형 열로 telecom_training의 상관관계 행렬을 만드세요.