LoslegenKostenlos loslegen

contamination wählen

Auch wenn die Code-Implementierung nur wenige Zeilen umfasst, erfordert das Finden einer passenden contamination Aufmerksamkeit.

Denk daran, dass der Parameter contamination nur die Ergebnisse von IForest beeinflusst. Sobald IForest rohe Anomalie-Scores erzeugt hat, wird contamination verwendet, um die obersten n% der Anomalie-Scores als Ausreißer auszuwählen. Bei 5 % contamination werden zum Beispiel die Beobachtungen mit den höchsten 5 % der Anomalie-Scores als Ausreißer markiert.

Wir besprechen gleich einige Tuning-Methoden im Video. Für den Moment übst du, dem Parameter einen beliebigen Wert zuzuweisen.

Die Daten sind als big_mart geladen.

Diese Übung ist Teil des Kurses

Anomalieerkennung mit Python

Kurs anzeigen

Anleitung zur Übung

  • Instanziiere einen IForest()-Schätzer mit 5 % contamination.
  • Fitte die Instanz auf die Big-Mart-Umsatzdaten.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

from pyod.models.iforest import IForest

# Instantiate an instance with 5% contamination
iforest = ____

# Fit IForest to Big Mart sales data
____
Code bearbeiten und ausführen