Trouver le plus proche voisin
Il est clair que l’algorithme du facteur d’anomalie local repose fortement sur la notion de plus proche voisin, laquelle dépend elle-même du choix de la métrique de distance. Vous décidez donc d’expérimenter davantage avec le jeu de données sur l’hépatite présenté dans la leçon précédente. Trois exemples sont fournis dans features, et leurs classes dans labels. Vous allez identifier, avec trois métriques de distance différentes — euclidienne, de Hamming et de Chebyshev — le plus proche voisin du premier exemple (ligne d’indice 0) et, sur cette base, choisir quelle métrique utiliser. Vous importerez le module nécessaire dans le cadre de l’exercice, mais pandas et numpy sont déjà disponibles, tout comme features et leurs étiquettes labels.
Cet exercice fait partie du cours
Concevoir des workflows de Machine Learning en Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import DistanceMetric as dm
from sklearn.____ import ____ as dm