1. 학습
  2. /
  3. 강의
  4. /
  5. R에서의 차원 축소

Connected

연습 문제

상호 정보가 있는 특성

credit_df 데이터 프레임에는 여러 연속형 특성이 들어 있어요. 두 개의 연속형 특성이 상관되어 있으면 동일한 정보를 담고 있는데, 이를 상호 정보라고 합니다. 상관이 매우 높은 특성은 단순히 중복일 뿐만 아니라 모델링에 문제를 일으킬 수 있어요. 예를 들어 회귀 분석에서는 상관이 매우 높은 특성(즉, 다중공선성) 때문에 말이 되지 않는 결과가 나올 수 있습니다. 상호 정보의 감을 잡기 위해 상관관계 플롯을 만들어 상호 정보가 있는 특성을 확인해 보겠습니다.

tidyverse와 corrr 패키지는 미리 불러와 두었습니다.

지침

100 XP
  • correlate()와 rplot()을 사용해 credit_df의 숫자형 특성에 대한 상관관계 플롯을 만드세요.