1. Learn
  2. /
  3. Courses
  4. /
  5. Python으로 배우는 이상치 탐지

Connected

Exercise

z-점수로 이상치 찾기

정규분포는 자연계에서 매우 흔하며, 가장 일반적으로 나타나는 분포예요. 그래서 z-점수 방법은 이상치를 빠르게 탐지하는 방법 중 하나가 될 수 있어요.

영상에서 본 경험 법칙을 기억하세요: 표본이 평균에서 표준편차의 3배를 넘게 떨어져 있으면 극단값으로 볼 수 있어요.

하지만 z-점수 방법은 주의해서 사용해야 한다는 점도 기억하세요. 이 방법은 데이터가 정규분포에서 왔다고 확신할 수 있을 때에만 적합해요. 그렇지 않으면 결과가 오해를 불러일으킬 수 있어요.

prices 분포가 미리 로드되어 있어요.

Instructions

100 XP
  • 해당 scipy 모듈에서 zscore 함수를 임포트하세요.
  • prices의 z-점수를 구해 scores에 저장하세요.
  • scores의 절댓값이 3보다 큰지 확인하는 부울 마스크 is_over_3를 만드세요.
  • 이 마스크를 사용해 prices에서 이상치만 필터링하세요.