IniziaInizia gratis

Rilevare outlier con IForest

IForest è uno stimatore robusto e richiede solo poche righe di codice per individuare gli outlier in qualsiasi insieme di dati. Probabilmente questa sintassi ti suonerà familiare, perché è molto simile a quella di sklearn.

La versione completa dei dati Big Mart Sales è stata caricata come big_mart, che puoi esplorare nella console.

Questo esercizio fa parte del corso

Rilevamento delle anomalie in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Importa lo stimatore IForest da pyod.
  • Inizializza un IForest() con i parametri predefiniti.
  • Esegui il fit dello stimatore e genera le predizioni su big_mart simultaneamente, salvando i risultati in labels.
  • Usa il subsetting di pandas per filtrare gli outlier da big_mart.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Import IForest from pyod
from pyod.____ import ____

# Initialize an instance with default parameters
iforest = ____

# Generate outlier labels
labels = ____

# Filter big_mart for outliers
outliers = ____

print(outliers.shape)
Modifica ed esegui il codice