LoF-Kontamination
Deine medizinische Beraterin beim Arrhythmie-Startup weist dich darauf hin, dass deine Trainingsdaten möglicherweise nicht alle möglichen Arrhythmie-Typen enthalten. Wie um alles in der Welt willst du diese anderen Typen ohne gelabelte Beispiele erkennen? Könnte ein Anomalie-Detektor zwischen gesund und ungesund unterscheiden, ohne Labels zu kennen? Zunächst experimentierst du jedoch mit dem Parameter für die Kontamination, um seine Auswirkung auf die Confusion-Matrix zu sehen. Du hast LocalOutlierFactor als lof, numpy als np, die Labels als ground_truth kodiert mit -1 und 1 genau wie die Ausgabe des Local Outlier Factor, und die nicht gelabelten Trainingsdaten als X.
Diese Übung ist Teil des Kurses
Machine-Learning-Workflows in Python entwerfen
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Fit the local outlier factor and output predictions
preds = lof().____(X)
# Print the confusion matrix
print(____(ground_truth, preds))