ComenzarEmpieza gratis

No todas las métricas coinciden

En el ejercicio anterior viste que no todas las métricas coinciden al identificar vecinos más cercanos. ¿Significa esto que también pueden discrepar en los valores atípicos? Decides ponerlo a prueba. Usas los mismos datos que antes, pero esta vez los pasas a un detector de valores atípicos basado en el factor de aislamiento local. El módulo LocalOutlierFactor está disponible como lof, y los datos como features.

Este ejercicio forma parte del curso

Diseño de flujos de trabajo de Machine Learning en Python

Ver curso

Instrucciones del ejercicio

  • Detecta valores atípicos en features usando la métrica euclidean.
  • Detecta valores atípicos en features usando la métrica hamming.
  • Detecta valores atípicos en features usando la métrica jaccard.
  • Averigua si las tres métricas coinciden en algún valor atípico.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Compute outliers according to the euclidean metric
out_eucl = ____(metric='euclidean').fit_predict(features)

# Compute outliers according to the hamming metric
out_hamm = ____(metric=____).fit_predict(features)

# Compute outliers according to the jaccard metric
out_jacc  = ____(____=____).____(features)

# Find if the metrics agree on any one datapoint
print(any(____ + ____ + ____ == ____))
Editar y ejecutar código