Alternative Klassifizierung mit IForest
Bisher hast du die Methode .fit_predict() verwendet, um IForest zu trainieren und gleichzeitig Vorhersagen zu erzeugen. Die pyod-Dokumentation empfiehlt jedoch, zuerst die Funktion fit zu nutzen und anschließend über ein praktisches Attribut auf die Inlier-/Outlier-labels_ zuzugreifen.
Das übst du jetzt mit dem Datensatz big_mart.
Diese Übung ist Teil des Kurses
Anomalieerkennung mit Python
Anleitung zur Übung
- Trainiere den
IForest()-Schätzer mitfit(nurfit) aufbig_mart. - Greife auf die Trainingslabels zu und speichere sie als
labels. - Verwende
pandas-Subsetting aufbig_mart, um die Ausreißer inoutlierszu filtern.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
iforest = IForest(n_estimators=200)
# Fit (only fit) it to the Big Mart sales
____
# Access the labels_ for the data
labels = iforest.____
# Filter outliers from big_mart
outliers = ____[____]
print(len(outliers))