Usare le probabilità di outlier
Un'alternativa all'isolamento degli outlier con contamination è usare le probabilità di outlier. Il vantaggio di questo metodo è che puoi scegliere una soglia di probabilità arbitraria, il che significa che puoi essere tanto prudente quanto vuoi nelle previsioni.
IForest e big_mart sono già caricati.
Questo esercizio fa parte del corso
Rilevamento delle anomalie in Python
Istruzioni dell'esercizio
- Calcola le probabilità sia per gli inlier sia per gli outlier.
- Estrai le probabilità degli outlier in
outlier_probs. - Filtra gli outlier in
outliersusando una soglia del 70% suoutlier_probs.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
iforest = IForest(random_state=10).fit(big_mart)
# Calculate probabilities
probs = iforest.____
# Extract the probabilities for outliers
outlier_probs = ____[____]
# Filter for when the probability is higher than 70%
outliers = ____[____]
print(len(outliers))