Toutes les métriques ne sont pas d’accord
Dans l’exercice précédent, vous avez vu que toutes les métriques ne s’accordent pas pour identifier les plus proches voisins. Mais est-ce que cela signifie qu’elles peuvent aussi diverger sur les anomalies ? Vous décidez de le vérifier. Vous reprenez les mêmes données que précédemment, mais cette fois vous les passez à un détecteur d’anomalies de type Local Outlier Factor. Le module LocalOutlierFactor vous est fourni sous le nom lof, et les données sont disponibles sous features.
Cet exercice fait partie du cours
Concevoir des workflows de Machine Learning en Python
Instructions
- Détectez les anomalies dans
featuresen utilisant la métriqueeuclidean. - Détectez les anomalies dans
featuresen utilisant la métriquehamming. - Détectez les anomalies dans
featuresen utilisant la métriquejaccard. - Vérifiez si les trois métriques s’accordent sur au moins une même anomalie.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Compute outliers according to the euclidean metric
out_eucl = ____(metric='euclidean').fit_predict(features)
# Compute outliers according to the hamming metric
out_hamm = ____(metric=____).fit_predict(features)
# Compute outliers according to the jaccard metric
out_jacc = ____(____=____).____(features)
# Find if the metrics agree on any one datapoint
print(any(____ + ____ + ____ == ____))