1. Learn
  2. /
  3. Courses
  4. /
  5. Python으로 배우는 이상치 탐지

Connected

Exercise

확률 집계 및 임계값 적용

앙상블을 사용할 때는 다양한 집계 방법을 선택할 수 있어요. 가장 널리 쓰이는 방법은 산술평균과 중앙값입니다.

평균은 거의 항상 사용할 수 있고, 중앙값은 estimators에 분류기가 최소 세 개 이상 있을 때 사용하는 것이 좋아요.

산술평균을 사용해 apple 데이터셋에서 이상치를 걸러 보세요. probability_scores와 apple은 이전 연습 문제에서 가져옵니다. NumPy도 로드되어 있어요.

Instructions

100 XP
  • probability_scores의 행을 따라 평균을 구하세요.
  • 확률이 0.75를 초과할 때 True를 반환하는 불리언 마스크를 만드세요.
  • is_outlier 마스크로 이상치를 필터링하세요.