1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Detekce anomálií v Pythonu

Connected

cvičení

Volba n_estimators

n_estimators je parametr, který má největší vliv na výkon modelu. Pokud sestavíš IForest s dostatečným počtem stromů, algoritmus získá potřebnou schopnost zobecňování a dokáže odlišit odlehlé hodnoty od běžných datových bodů. Optimální počet stromů závisí na velikosti datasetu – příliš vysoká i příliš nízká hodnota může vést k nepřesným předpovědím.

Vyzkoušej si nastavení n_estimators na datasetu big_mart, který je už načtený spolu s IForest z pyod.

Pokyny

100 XP
  • Vytvoř estimátor IForest() s 300 iTrees.
  • Natrénuj ho na datech big_mart.