KNN con probabilidades de outlier
Como no podemos confiar del todo en el resultado al usar contamination, vamos a comprobar el trabajo con probabilidades de outlier. Son más fiables.
El conjunto de datos se ha cargado como females y el estimador KNN también está importado.
Este ejercicio forma parte del curso
Detección de anomalías en Python
Instrucciones del ejercicio
- Instancia
KNNcon 20 vecinos. - Calcula las probabilidades de outlier.
- Crea una máscara booleana que devuelva valores verdaderos donde la probabilidad de outlier sea superior al 55%.
- Usa
is_outlierpara filtrar los outliers defemales.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Instantiate a KNN with 20 neighbors and fit to `females`
knn = ____
knn.____
# Calculate probabilities
probs = ____
# Create a boolean mask
is_outlier = ____
# Use the boolean mask to filter the outliers
outliers = ____
print(len(outliers))