LoF-contaminatie
Je medisch adviseur bij de aritmie-startup laat weten dat je trainingsgegevens mogelijk niet alle soorten aritmie bevatten. Hoe ga je in hemelsnaam die andere types detecteren zonder gelabelde voorbeelden? Kan een anomaliedetector het verschil zien tussen gezond en ongezond zonder labels? Eerst ga je echter experimenteren met de parameter voor contaminatie om het effect op de verwarringsmatrix te bekijken. Je hebt LocalOutlierFactor als lof, numpy als np, de labels als ground_truth gecodeerd als -1 en 1 net als de output van Local Outlier Factor, en de ongelabelde trainingsgegevens als X.
Deze oefening maakt deel uit van de cursus
Machine Learning-workflows ontwerpen in Python
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Fit the local outlier factor and output predictions
preds = lof().____(X)
# Print the confusion matrix
print(____(ground_truth, preds))