1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 배우는 이상치 탐지

Connected

연습 문제

처음 만나는 KNN

여성 대상 Ansur Body Measurements 데이터셋 버전으로 처음 KNN을 연습해 볼 거예요. 이 여성 버전에는 열이 95개이고 관측치는 1.9천 개뿐이에요.

데이터셋은 환경에 females로 로드되어 있어요.

지침

100 XP
  • 관련 pyod 모듈에서 KNN 추정기를 임포트하세요.
  • contamination을 0.5%로, 이웃 수를 20으로 지정한 KNN() 추정기를 knn으로 인스턴스화하세요.
  • knn의 labels_가 1일 때 True를 반환하는 불리언 인덱스 is_outlier를 만드세요.
  • is_outlier를 사용해 females에서 이상치만 골라 outliers에 저장하세요.