Toutes les métriques ne sont pas d’accord
Dans l’exercice précédent, vous avez vu que toutes les métriques ne s’accordent pas pour identifier les plus proches voisins. Mais est-ce que cela signifie qu’elles peuvent aussi diverger sur les anomalies ? Vous décidez de le vérifier. Vous reprenez les mêmes données que précédemment, mais cette fois vous les passez à un détecteur d’anomalies de type Local Outlier Factor. Le module LocalOutlierFactor vous est fourni sous le nom lof, et les données sont disponibles sous features.
Cet exercice fait partie du cours
<cours>Concevoir des workflows de Machine Learning en Python</cours>Instructions de l’exercice
- Détectez les anomalies dans
featuresen utilisant la métriqueeuclidean. - Détectez les anomalies dans
featuresen utilisant la métriquehamming. - Détectez les anomalies dans
featuresen utilisant la métriquejaccard. - Vérifiez si les trois métriques s’accordent sur au moins une même anomalie.
Exercice interactif pratique
Essayez cet exercice en complétant ce code d’exemple.
# Compute outliers according to the euclidean metric
out_eucl = ____(metric='euclidean').fit_predict(features)
# Compute outliers according to the hamming metric
out_hamm = ____(metric=____).fit_predict(features)
# Compute outliers according to the jaccard metric
out_jacc = ____(____=____).____(features)
# Find if the metrics agree on any one datapoint
print(any(____ + ____ + ____ == ____))