1. Nauka
  2. /
  3. Kursy
  4. /
  5. Wykrywanie anomalii w Pythonie

Connected

ćwiczenie

Dobór parametru contamination

Choć implementacja kodu zajmuje zaledwie kilka linii, dobór odpowiedniej wartości parametru contamination wymaga uwagi.

Pamiętaj, że parametr contamination wpływa wyłącznie na wyniki IForest. Gdy IForest wygeneruje surowe wyniki anomalii, contamination służy do wybrania górnych n% tych wyników jako wartości odstających. Na przykład wartość 5% oznacza, że obserwacje z najwyższymi 5% wyników anomalii zostaną uznane za wartości odstające.

Metody strojenia tego parametru omówimy w kolejnym filmie, ale najpierw poćwicz ustawianie dowolnej wartości parametru.

Dane są wczytane jako big_mart.

Instrukcje

100 XP
  • Utwórz instancję estymatora IForest() z parametrem contamination ustawionym na 5%.
  • Dopasuj instancję do danych sprzedażowych Big Mart.