1. Учиться
  2. /
  3. Courses
  4. /
  5. Python으로 배우는 이상치 탐지

Connected

Exercise

contamination 선택하기

코드는 몇 줄이면 되지만, 적절한 contamination 값을 찾으려면 주의가 필요해요.

contamination 매개변수는 IForest의 결과에만 영향을 준다는 점을 기억하세요. IForest가 원시 이상치 점수를 만든 다음, contamination을 사용해 이상치로 간주할 상위 n%의 점수를 선택합니다. 예를 들어 contamination이 5%라면, 이상치 점수가 가장 높은 5% 관측치를 이상치로 선택합니다.

다음 영상에서 일부 튜닝 방법을 다루겠지만, 지금은 매개변수에 임의의 값을 설정하는 연습을 해 보겠습니다.

데이터는 big_mart로 로드되어 있습니다.

Инструкции

100 XP
  • contamination을 5%로 설정한 IForest() 추정기를 인스턴스화하세요.
  • Big Mart 매출 데이터에 해당 인스턴스를 학습(fit)하세요.