LoslegenKostenlos starten

contamination wählen

Auch wenn die Code-Implementierung nur wenige Zeilen umfasst, erfordert das Finden einer passenden contamination Aufmerksamkeit.

Denk daran, dass der Parameter contamination nur die Ergebnisse von IForest beeinflusst. Sobald IForest rohe Anomalie-Scores erzeugt hat, wird contamination verwendet, um die obersten n% der Anomalie-Scores als Ausreißer auszuwählen. Bei 5 % contamination werden zum Beispiel die Beobachtungen mit den höchsten 5 % der Anomalie-Scores als Ausreißer markiert.

Wir besprechen gleich einige Tuning-Methoden im Video. Für den Moment übst du, dem Parameter einen beliebigen Wert zuzuweisen.

Die Daten sind als big_mart geladen.

Diese Übung ist Teil des Kurses

<Kurs>Anomalieerkennung mit Python</Kurs>
Kurs ansehen

Übungsanweisungen

  • Instanziiere einen IForest()-Schätzer mit 5 % contamination.
  • Fitte die Instanz auf die Big-Mart-Umsatzdaten.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

from pyod.models.iforest import IForest

# Instantiate an instance with 5% contamination
iforest = ____

# Fit IForest to Big Mart sales data
____
Code bearbeiten und ausführen