Rilevare outlier con IForest
IForest è uno stimatore robusto e richiede solo poche righe di codice per individuare gli outlier in qualsiasi insieme di dati. Probabilmente questa sintassi ti suonerà familiare, perché è molto simile a quella di sklearn.
La versione completa dei dati Big Mart Sales è stata caricata come big_mart, che puoi esplorare nella console.
Questo esercizio fa parte del corso
Rilevamento delle anomalie in Python
Istruzioni dell'esercizio
- Importa lo stimatore
IForestdapyod. - Inizializza un
IForest()con i parametri predefiniti. - Esegui il fit dello stimatore e genera le predizioni su
big_martsimultaneamente, salvando i risultati inlabels. - Usa il subsetting di
pandasper filtrare gli outlier dabig_mart.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Import IForest from pyod
from pyod.____ import ____
# Initialize an instance with default parameters
iforest = ____
# Generate outlier labels
labels = ____
# Filter big_mart for outliers
outliers = ____
print(outliers.shape)