Aan de slagGa gratis aan de slag

Niet alle metriekwaarden zijn het eens

In de vorige oefening zag je dat niet alle metriekwaarden het eens zijn bij het bepalen van naaste buren. Maar betekent dit ook dat ze van mening kunnen verschillen over outliers? Je besluit dit te testen. Je gebruikt dezelfde data als eerder, maar voedt die nu aan een Local Outlier Factor-outlierdetector. De module LocalOutlierFactor is beschikbaar gemaakt als lof, en de data als features.

Deze oefening maakt deel uit van de cursus

Machine Learning-workflows ontwerpen in Python

Cursus bekijken

Oefeninstructies

  • Detecteer outliers in features met de euclidean-metriek.
  • Detecteer outliers in features met de hamming-metriek.
  • Detecteer outliers in features met de jaccard-metriek.
  • Kijk of alle drie de metriekwaarden het over ten minste één outlier eens zijn.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Compute outliers according to the euclidean metric
out_eucl = ____(metric='euclidean').fit_predict(features)

# Compute outliers according to the hamming metric
out_hamm = ____(metric=____).fit_predict(features)

# Compute outliers according to the jaccard metric
out_jacc  = ____(____=____).____(features)

# Find if the metrics agree on any one datapoint
print(any(____ + ____ + ____ == ____))
Code bewerken en uitvoeren