ComenzarEmpieza gratis

KNN con probabilidades de outlier

Como no podemos confiar del todo en el resultado al usar contamination, vamos a comprobar el trabajo con probabilidades de outlier. Son más fiables.

El conjunto de datos se ha cargado como females y el estimador KNN también está importado.

Este ejercicio forma parte del curso

Detección de anomalías en Python

Ver curso

Instrucciones del ejercicio

  • Instancia KNN con 20 vecinos.
  • Calcula las probabilidades de outlier.
  • Crea una máscara booleana que devuelva valores verdaderos donde la probabilidad de outlier sea superior al 55%.
  • Usa is_outlier para filtrar los outliers de females.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Instantiate a KNN with 20 neighbors and fit to `females`
knn = ____
knn.____

# Calculate probabilities
probs = ____

# Create a boolean mask
is_outlier = ____

# Use the boolean mask to filter the outliers
outliers = ____

print(len(outliers))
Editar y ejecutar código