ComenzarEmpieza gratis

LOF con probabilidades de atípicos

Como siempre, comprueba dos veces que el nivel de contaminación elegido es fiable filtrando las observaciones atípicas con un umbral de probabilidad. La sintaxis es la misma que con KNN.

El estimador LOF ya se ha importado y el conjunto de datos females_transformed también está disponible.

Este ejercicio forma parte del curso

Detección de anomalías en Python

Ver curso

Instrucciones del ejercicio

  • Instancia LOF() con 20 vecinos.
  • Calcula las probabilidades de atípicos en probs.
  • Crea una máscara booleana llamada is_outlier que devuelva valores verdaderos cuando la probabilidad de ser atípico supere el 50%.
  • Usa is_outlier para filtrar las observaciones atípicas de females_transformed.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Instantiate an LOF with 20 neighbors and fit to the data
lof = ____
lof.____

# Calculate probabilities
probs = ____

# Create a boolean mask
is_outlier = ____

# Use the boolean mask to filter the outliers
outliers = ____

print(len(outliers))
Editar y ejecutar código