IniziaInizia gratis

Usare le probabilità di outlier

Un'alternativa all'isolamento degli outlier con contamination è usare le probabilità di outlier. Il vantaggio di questo metodo è che puoi scegliere una soglia di probabilità arbitraria, il che significa che puoi essere tanto prudente quanto vuoi nelle previsioni.

IForest e big_mart sono già caricati.

Questo esercizio fa parte del corso

Rilevamento delle anomalie in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Calcola le probabilità sia per gli inlier sia per gli outlier.
  • Estrai le probabilità degli outlier in outlier_probs.
  • Filtra gli outlier in outliers usando una soglia del 70% su outlier_probs.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

iforest = IForest(random_state=10).fit(big_mart)

# Calculate probabilities
probs = iforest.____

# Extract the probabilities for outliers
outlier_probs = ____[____]

# Filter for when the probability is higher than 70%
outliers = ____[____]

print(len(outliers))
Modifica ed esegui il codice