CommencerCommencez gratuitement

Toutes les métriques ne sont pas d’accord

Dans l’exercice précédent, vous avez vu que toutes les métriques ne s’accordent pas pour identifier les plus proches voisins. Mais est-ce que cela signifie qu’elles peuvent aussi diverger sur les anomalies ? Vous décidez de le vérifier. Vous reprenez les mêmes données que précédemment, mais cette fois vous les passez à un détecteur d’anomalies de type Local Outlier Factor. Le module LocalOutlierFactor vous est fourni sous le nom lof, et les données sont disponibles sous features.

Cet exercice fait partie du cours

<cours>Concevoir des workflows de Machine Learning en Python</cours>
Voir le cours

Instructions de l’exercice

  • Détectez les anomalies dans features en utilisant la métrique euclidean.
  • Détectez les anomalies dans features en utilisant la métrique hamming.
  • Détectez les anomalies dans features en utilisant la métrique jaccard.
  • Vérifiez si les trois métriques s’accordent sur au moins une même anomalie.

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Compute outliers according to the euclidean metric
out_eucl = ____(metric='euclidean').fit_predict(features)

# Compute outliers according to the hamming metric
out_hamm = ____(metric=____).fit_predict(features)

# Compute outliers according to the jaccard metric
out_jacc  = ____(____=____).____(features)

# Find if the metrics agree on any one datapoint
print(any(____ + ____ + ____ == ____))
Modifier et exécuter le code