Un altro modo per classificare con IForest
Finora hai usato il metodo .fit_predict() per addestrare IForest e generare le predizioni contemporaneamente. Tuttavia, la documentazione di pyod suggerisce di usare prima la funzione fit e poi accedere alle etichette inlier/outlier tramite un comodo attributo labels_.
Metterai in pratica questo approccio sul dataset big_mart.
Questo esercizio fa parte del corso
Rilevamento delle anomalie in Python
Istruzioni dell'esercizio
- Esegui il fit (solo
fit) dell’estimatoreIForest()subig_mart. - Accedi alle etichette di training e salvale in
labels. - Usa il sottoinsieme di
pandassubig_martper filtrare gli outlier inoutliers.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
iforest = IForest(n_estimators=200)
# Fit (only fit) it to the Big Mart sales
____
# Access the labels_ for the data
labels = iforest.____
# Filter outliers from big_mart
outliers = ____[____]
print(len(outliers))