1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 배우는 이상치 탐지

Connected

연습 문제

QuantileTransformer 테스트

표준화는 z-점수와 같은 함정을 가질 수 있어요. 둘 다 평균과 표준편차를 계산에 사용하므로, 극단값에 매우 민감합니다.

이 문제를 피하려면 분위수를 사용하는 QuantileTransformer를 활용하는 것이 좋습니다. 분포의 분위수는 이상치의 크기와 상관없이 일정하게 유지돼요.

데이터가 정규분포를 따른다면(히스토그램으로 확인 가능) StandardScaler를 사용하세요. 그 외 분포에서는 QuantileTransformer가 더 적합합니다.

불러온 females 데이터셋으로 연습해 보세요. matplotlib.pyplot은 표준 별칭인 plt로 불러와져 있습니다.

지침

100 XP
  • 특성을 정규분포로 변환하도록 QuantileTransformer()를 인스턴스화하고 qt에 할당하세요.
  • 특성 배열 X를 적합 후 변환하고, 열 이름을 보존하세요.
  • palmlength 열의 히스토그램을 그리세요.