1. Uczyć się
  2. /
  3. Courses
  4. /
  5. Python으로 배우는 이상치 탐지

Connected

Exercise

n_estimators 선택하기

n_estimators는 모델 성능에 가장 큰 영향을 주는 하이퍼파라미터예요. IForest에 충분한 트리를 구축하면, 이상치를 정상 데이터 포인트와 분리할 수 있을 만큼 알고리즘의 일반화 능력이 확보됩니다. 최적의 트리 개수는 데이터셋 크기에 따라 달라지며, 너무 크거나 작으면 예측이 부정확해질 수 있어요.

pyod의 IForest와 함께 미리 로드된 big_mart 데이터셋에서 n_estimators를 설정하는 연습을 해 보세요.

Instrukcje

100 XP
  • 300개의 iTree로 IForest() 추정기를 생성하세요.
  • 생성한 인스턴스를 big_mart에 맞춰 학습(fit)하세요.