Ausreißer mit IForest erkennen
IForest ist ein robuster Schätzer und benötigt nur wenige Zeilen Code, um Ausreißer in jedem Datensatz zu erkennen. Die Syntax kommt dir vielleicht bekannt vor, da sie der sklearn-Syntax sehr ähnlich ist.
Die vollständige Version der Big-Mart-Sales-Daten wurde als big_mart für dich geladen. Du kannst sie in der Konsole erkunden.
Diese Übung ist Teil des Kurses
Anomalieerkennung mit Python
Anleitung zur Übung
- Importiere den
IForest-Schätzer auspyod. - Initialisiere ein
IForest()mit Standardparametern. - Fitte den Schätzer und erzeuge gleichzeitig Vorhersagen auf
big_mart, und speichere die Ergebnisse inlabels. - Verwende
pandas-Subsetting, um die Ausreißer ausbig_martherauszufiltern.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Import IForest from pyod
from pyod.____ import ____
# Initialize an instance with default parameters
iforest = ____
# Generate outlier labels
labels = ____
# Filter big_mart for outliers
outliers = ____
print(outliers.shape)