Contaminación en LoF
Tu asesor médico en la startup de arritmias te informa de que tus datos de entrenamiento podrían no incluir todos los tipos de arritmia posibles. ¿Cómo vas a detectar esos otros tipos sin ejemplos etiquetados? ¿Podría un detector de anomalías distinguir entre sanos y enfermos sin acceder a etiquetas? Pero antes, experimenta con el parámetro de contaminación para ver su efecto en la matriz de confusión. Tienes LocalOutlierFactor como lof, numpy como np, las etiquetas como ground_truth codificadas en -1 y 1 igual que la salida de local outlier factor, y los datos de entrenamiento sin etiquetar como X.
Este ejercicio forma parte del curso
Diseño de flujos de trabajo de Machine Learning en Python
ejercicio interactivo práctico
Prueba este ejercicio completando este código de ejemplo.
# Fit the local outlier factor and output predictions
preds = lof().____(X)
# Print the confusion matrix
print(____(ground_truth, preds))