KNN avec probabilités d’anomalie
Comme nous ne pouvons pas nous fier entièrement au résultat lorsque nous utilisons contamination, vérifions notre travail à l’aide des probabilités d’anomalie. Elles sont plus fiables.
Le jeu de données a été chargé sous le nom females et l’estimateur KNN est également importé.
Cet exercice fait partie du cours
Détection d’anomalies en Python
Instructions
- Instanciez
KNNavec 20 voisins. - Calculez les probabilités d’anomalie.
- Créez un masque booléen qui renvoie des valeurs vraies lorsque la probabilité d’anomalie est supérieure à 55 %.
- Utilisez
is_outlierpour filtrer les anomalies à partir defemales.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Instantiate a KNN with 20 neighbors and fit to `females`
knn = ____
knn.____
# Calculate probabilities
probs = ____
# Create a boolean mask
is_outlier = ____
# Use the boolean mask to filter the outliers
outliers = ____
print(len(outliers))