Niet alle metriekwaarden zijn het eens
In de vorige oefening zag je dat niet alle metriekwaarden het eens zijn bij het bepalen van naaste buren. Maar betekent dit ook dat ze van mening kunnen verschillen over outliers? Je besluit dit te testen. Je gebruikt dezelfde data als eerder, maar voedt die nu aan een Local Outlier Factor-outlierdetector. De module LocalOutlierFactor is beschikbaar gemaakt als lof, en de data als features.
Deze oefening maakt deel uit van de cursus
Machine Learning-workflows ontwerpen in Python
Oefeninstructies
- Detecteer outliers in
featuresmet deeuclidean-metriek. - Detecteer outliers in
featuresmet dehamming-metriek. - Detecteer outliers in
featuresmet dejaccard-metriek. - Kijk of alle drie de metriekwaarden het over ten minste één outlier eens zijn.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Compute outliers according to the euclidean metric
out_eucl = ____(metric='euclidean').fit_predict(features)
# Compute outliers according to the hamming metric
out_hamm = ____(metric=____).fit_predict(features)
# Compute outliers according to the jaccard metric
out_jacc = ____(____=____).____(features)
# Find if the metrics agree on any one datapoint
print(any(____ + ____ + ____ == ____))