1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Detekce anomálií v Pythonu

Connected

cvičení

Volba kontaminace

I když samotná implementace zabere jen pár řádků kódu, správné nastavení kontaminace vyžaduje pozornost.

Měj na paměti, že parametr contamination ovlivňuje pouze výsledky IForest. Jakmile IForest vygeneruje hrubé skóre anomálií, contamination slouží k výběru horních n % těchto skóre jako odlehlých hodnot. Například 5% kontaminace označí jako odlehlé ty pozorování, která mají nejvyšších 5 % skóre anomálií.

Ačkoli si v následujícím videu ukážeme několik metod ladění, prozatím si procvičíš nastavení libovolné hodnoty tohoto parametru.

Data jsou načtena jako big_mart.

Pokyny

100 XP
  • Vytvoř instanci estimátoru IForest() s 5% contamination.
  • Natrénuj instanci na prodejních datech Big Mart.