1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Detekce anomálií v Pythonu

Connected

Cvičení

Detekce odlehlých hodnot pomocí IForest

IForest je robustní estimátor a k detekci odlehlých hodnot v libovolném datasetu stačí jen pár řádků kódu. Syntaxe ti možná přijde povědomá – velmi se podobá syntaxi sklearn.

Plná verze dat Big Mart Sales je načtena jako big_mart, kterou si můžeš prozkoumat v konzoli.

Pokyny

100 XP
  • Importuj estimátor IForest z pyod.
  • Inicializuj IForest() s výchozími parametry.
  • Natrénuj estimátor a zároveň vygeneruj predikce na datech big_mart, výsledky ulož do labels.
  • Pomocí filtrování v pandas vyber z big_mart pouze odlehlé hodnoty.