1. Учиться
  2. /
  3. Courses
  4. /
  5. R에서의 차원 축소

Connected

Exercise

높은 상관관계 레시피 만들기

상관관계가 높은 특성을 찾아냈다면, 수동으로 제거하는 대신 tidymodels의 step_corr() 레시피 단계를 사용할 수 있습니다. step_corr()는 다른 특성과 상관관계가 있는 모든 특성을 제거하지 않습니다. 가능한 한 적은 특성만 제거하려고 시도합니다. 개념적으로는, 객관식 연습에서 보셨듯이 다른 특성들의 어떤 조합과도 가장 많이 겹치는 특성을 제거합니다. 핵심 아이디어는 다른 특성들이 동일한 정보를 담고 있으므로, 제거된 특성의 겹치는 정보는 여전히 그 다른 특성들에 의해 표현된다는 것입니다.

tidyverse와 tidymodels 패키지는 미리 로드되어 있습니다.

Инструкции

100 XP
  • 숫자형 예측 변수에만 적용되도록, 임계값을 0.7로 한 step_corr()를 사용하는 레시피를 만드세요.
  • 레시피를 house_sales_df에 적용하고, 필터링된 데이터를 filtered_house_sales_df에 저장하세요.
  • tidy()를 사용해 step_corr() 필터가 제거한 열(들)을 확인하세요.