contamination wählen
Auch wenn die Code-Implementierung nur wenige Zeilen umfasst, erfordert das Finden einer passenden contamination Aufmerksamkeit.
Denk daran, dass der Parameter contamination nur die Ergebnisse von IForest beeinflusst. Sobald IForest rohe Anomalie-Scores erzeugt hat, wird contamination verwendet, um die obersten n% der Anomalie-Scores als Ausreißer auszuwählen. Bei 5 % contamination werden zum Beispiel die Beobachtungen mit den höchsten 5 % der Anomalie-Scores als Ausreißer markiert.
Wir besprechen gleich einige Tuning-Methoden im Video. Für den Moment übst du, dem Parameter einen beliebigen Wert zuzuweisen.
Die Daten sind als big_mart geladen.
Diese Übung ist Teil des Kurses
Anomalieerkennung mit Python
Anleitung zur Übung
- Instanziiere einen
IForest()-Schätzer mit 5 %contamination. - Fitte die Instanz auf die Big-Mart-Umsatzdaten.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
from pyod.models.iforest import IForest
# Instantiate an instance with 5% contamination
iforest = ____
# Fit IForest to Big Mart sales data
____