1. Learn
  2. /
  3. Courses
  4. /
  5. Wykrywanie anomalii w Pythonie

Connected

Exercise

Wybór n_estimators

n_estimators to parametr, który ma największy wpływ na wydajność modelu. Zbudowanie IForest z odpowiednią liczbą drzew zapewnia algorytmowi wystarczającą zdolność generalizacji, by odizolować wartości odstające od normalnych punktów danych. Optymalna liczba drzew zależy od rozmiaru zbioru danych – zarówno zbyt duża, jak i zbyt mała wartość prowadzi do niedokładnych przewidywań.

Przećwicz ustawianie n_estimators na zbiorze danych big_mart, który został już wczytany razem z IForest z biblioteki pyod.

Instructions

100 XP
  • Utwórz estymator IForest() z 300 drzewami izolacji.
  • Dopasuj instancję do zbioru danych big_mart.