Usar probabilidades de outliers
Una alternativa a aislar outliers con contamination es usar probabilidades de outliers. Lo mejor de este método es que puedes elegir un umbral de probabilidad arbitrario, lo que significa que puedes ser tan exigente como quieras con las predicciones.
IForest y big_mart ya están cargados.
Este ejercicio forma parte del curso
Detección de anomalías en Python
Instrucciones del ejercicio
- Calcula las probabilidades tanto para inliers como para outliers.
- Extrae las probabilidades de outliers en
outlier_probs. - Filtra los outliers en
outliersusando un umbral del 70% enoutlier_probs.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
iforest = IForest(random_state=10).fit(big_mart)
# Calculate probabilities
probs = iforest.____
# Extract the probabilities for outliers
outlier_probs = ____[____]
# Filter for when the probability is higher than 70%
outliers = ____[____]
print(len(outliers))