LoslegenKostenlos starten

Alternative Klassifizierung mit IForest

Bisher hast du die Methode .fit_predict() verwendet, um IForest zu trainieren und gleichzeitig Vorhersagen zu erzeugen. Die pyod-Dokumentation empfiehlt jedoch, zuerst die Funktion fit zu nutzen und anschließend über ein praktisches Attribut auf die Inlier-/Outlier-labels_ zuzugreifen.

Das übst du jetzt mit dem Datensatz big_mart.

Diese Übung ist Teil des Kurses

<Kurs>Anomalieerkennung mit Python</Kurs>
Kurs ansehen

Übungsanweisungen

  • Trainiere den IForest()-Schätzer mit fit (nur fit) auf big_mart.
  • Greife auf die Trainingslabels zu und speichere sie als labels.
  • Verwende pandas-Subsetting auf big_mart, um die Ausreißer in outliers zu filtern.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

iforest = IForest(n_estimators=200)

# Fit (only fit) it to the Big Mart sales
____

# Access the labels_ for the data
labels = iforest.____

# Filter outliers from big_mart
outliers = ____[____]

print(len(outliers))
Code bearbeiten und ausführen