LOF con probabilidades de atípicos
Como siempre, comprueba dos veces que el nivel de contaminación elegido es fiable filtrando las observaciones atípicas con un umbral de probabilidad. La sintaxis es la misma que con KNN.
El estimador LOF ya se ha importado y el conjunto de datos females_transformed también está disponible.
Este ejercicio forma parte del curso
Detección de anomalías en Python
Instrucciones del ejercicio
- Instancia
LOF()con 20 vecinos. - Calcula las probabilidades de atípicos en
probs. - Crea una máscara booleana llamada
is_outlierque devuelva valores verdaderos cuando la probabilidad de ser atípico supere el 50%. - Usa
is_outlierpara filtrar las observaciones atípicas defemales_transformed.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Instantiate an LOF with 20 neighbors and fit to the data
lof = ____
lof.____
# Calculate probabilities
probs = ____
# Create a boolean mask
is_outlier = ____
# Use the boolean mask to filter the outliers
outliers = ____
print(len(outliers))