ComenzarEmpieza gratis

Usar probabilidades de outliers

Una alternativa a aislar outliers con contamination es usar probabilidades de outliers. Lo mejor de este método es que puedes elegir un umbral de probabilidad arbitrario, lo que significa que puedes ser tan exigente como quieras con las predicciones.

IForest y big_mart ya están cargados.

Este ejercicio forma parte del curso

Detección de anomalías en Python

Ver curso

Instrucciones del ejercicio

  • Calcula las probabilidades tanto para inliers como para outliers.
  • Extrae las probabilidades de outliers en outlier_probs.
  • Filtra los outliers en outliers usando un umbral del 70% en outlier_probs.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

iforest = IForest(random_state=10).fit(big_mart)

# Calculate probabilities
probs = iforest.____

# Extract the probabilities for outliers
outlier_probs = ____[____]

# Filter for when the probability is higher than 70%
outliers = ____[____]

print(len(outliers))
Editar y ejecutar código