KNN pour la première fois
Vous allez pratiquer KNN pour la première fois sur une version du jeu de données Ansur Body Measurements pour femmes. Cette version contient également 95 colonnes, mais seulement 1,9 k observations.
Le jeu de données a été chargé dans l’environnement sous le nom females.
Cet exercice fait partie du cours
Détection d’anomalies en Python
Instructions
- Importez l’estimateur
KNNdepuis le modulepyodapproprié. - Instanciez un estimateur
KNN()avec 0,5 % de contamination et 20 voisins, sous le nomknn. - Créez un index booléen nommé
is_outlierqui renvoieTruelorsquelabels_deknnrenvoie 1. - Isolez les valeurs aberrantes de
femalesà l’aide deis_outlierdansoutliers.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import KNN from the relevant pyod module
from pyod.____ import ____
# Instantiate KNN and fit to females
knn = KNN(____, ____, n_jobs=-1)
knn.____
# Create a boolean index that checks for outliers
is_outlier = ____
# Isolate the outliers
outliers = ____
print(len(outliers))