Nem todas as métricas concordam
No exercício anterior, você viu que nem todas as métricas concordam na hora de identificar vizinhos mais próximos. Mas isso significa que elas também podem discordar sobre outliers? Você decide colocar isso à prova. Você usa os mesmos dados de antes, mas desta vez os envia para um detector de outliers do tipo local outlier factor. O módulo LocalOutlierFactor foi disponibilizado para você como lof, e os dados estão em features.
Este exercício faz parte do curso
Projetando Workflows de Machine Learning em Python
Instruções do exercício
- Detecte outliers em
featuresusando a métricaeuclidean. - Detecte outliers em
featuresusando a métricahamming. - Detecte outliers em
featuresusando a métricajaccard. - Descubra se as três métricas concordam em algum outlier.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Compute outliers according to the euclidean metric
out_eucl = ____(metric='euclidean').fit_predict(features)
# Compute outliers according to the hamming metric
out_hamm = ____(metric=____).fit_predict(features)
# Compute outliers according to the jaccard metric
out_jacc = ____(____=____).____(features)
# Find if the metrics agree on any one datapoint
print(any(____ + ____ + ____ == ____))