Ausreißer mit IForest erkennen
IForest ist ein robuster Schätzer und benötigt nur wenige Zeilen Code, um Ausreißer in jedem Datensatz zu erkennen. Die Syntax kommt dir vielleicht bekannt vor, da sie der sklearn-Syntax sehr ähnlich ist.
Die vollständige Version der Big-Mart-Sales-Daten wurde als big_mart für dich geladen. Du kannst sie in der Konsole erkunden.
Diese Übung ist Teil des Kurses
<Kurs>Anomalieerkennung mit Python</Kurs>Übungsanweisungen
- Importiere den
IForest-Schätzer auspyod. - Initialisiere ein
IForest()mit Standardparametern. - Fitte den Schätzer und erzeuge gleichzeitig Vorhersagen auf
big_mart, und speichere die Ergebnisse inlabels. - Verwende
pandas-Subsetting, um die Ausreißer ausbig_martherauszufiltern.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Import IForest from pyod
from pyod.____ import ____
# Initialize an instance with default parameters
iforest = ____
# Generate outlier labels
labels = ____
# Filter big_mart for outliers
outliers = ____
print(outliers.shape)