1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 배우는 차원 축소

Connected

연습 문제

분산이 낮은 특성

이전 연습 문제에서 정규화 후 head_df에서 분산이 낮은 특성을 거르기 위한 임계값으로 0.001이 적절하다는 것을 확인하셨습니다. 이제 VarianceThreshold 특성 선택기를 사용해 이러한 특성을 제거해 보세요.

지침

100 XP
  • 임계값 0.001로 분산 임계값 선택기를 생성하세요.
  • head_df DataFrame을 평균값으로 나누어 정규화하고, 선택기를 적합(fit)하세요.
  • .get_support()으로 선택기에서 불리언 마스크를 생성하세요.
  • .loc[] 메서드에 이 마스크를 전달하여 축소된 DataFrame을 만드세요.