Non tutte le metriche sono d'accordo
Nel precedente esercizio hai visto che non tutte le metriche concordano nell’identificare i vicini più prossimi. Ma questo significa che potrebbero non essere d'accordo anche sugli outlier? Decidi di metterlo alla prova. Usi gli stessi dati di prima, ma questa volta li passi a un rilevatore di outlier basato sul Local Outlier Factor. Il modulo LocalOutlierFactor è stato messo a tua disposizione come lof, e i dati sono disponibili come features.
Questo esercizio fa parte del corso
Progettare workflow di Machine Learning in Python
Istruzioni dell'esercizio
- Rileva gli outlier in
featuresusando la metricaeuclidean. - Rileva gli outlier in
featuresusando la metricahamming. - Rileva gli outlier in
featuresusando la metricajaccard. - Verifica se tutte e tre le metriche concordano su almeno un outlier.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Compute outliers according to the euclidean metric
out_eucl = ____(metric='euclidean').fit_predict(features)
# Compute outliers according to the hamming metric
out_hamm = ____(metric=____).fit_predict(features)
# Compute outliers according to the jaccard metric
out_jacc = ____(____=____).____(features)
# Find if the metrics agree on any one datapoint
print(any(____ + ____ + ____ == ____))