Contamination LoF
Votre conseiller médical dans la startup d’arythmie vous informe que vos données d’entraînement pourraient ne pas couvrir tous les types possibles d’arythmie. Comment détecter ces autres types sans aucun exemple étiqueté ? Un détecteur d’anomalies pourrait-il distinguer le normal du pathologique sans labels ? Avant cela, vous allez faire varier le paramètre de contamination pour observer son effet sur la matrice de confusion. Vous disposez de LocalOutlierFactor sous le nom lof, de numpy en np, des étiquettes ground_truth encodées en -1 et 1 comme la sortie de Local Outlier Factor, ainsi que des données d’entraînement non étiquetées X.
Cet exercice fait partie du cours
Concevoir des workflows de Machine Learning en Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Fit the local outlier factor and output predictions
preds = lof().____(X)
# Print the confusion matrix
print(____(ground_truth, preds))