Contaminación en LoF
Tu asesor médico en la startup de arritmias te informa de que tus datos de entrenamiento podrían no incluir todos los tipos de arritmia posibles. ¿Cómo vas a detectar esos otros tipos sin ejemplos etiquetados? ¿Podría un detector de anomalías distinguir entre sanos y enfermos sin acceder a etiquetas? Pero antes, experimenta con el parámetro de contaminación para ver su efecto en la matriz de confusión. Tienes LocalOutlierFactor como lof, numpy como np, las etiquetas como ground_truth codificadas en -1 y 1 igual que la salida de local outlier factor, y los datos de entrenamiento sin etiquetar como X.
Este ejercicio forma parte del curso
Diseño de flujos de trabajo de Machine Learning en Python
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Fit the local outlier factor and output predictions
preds = lof().____(X)
# Print the confusion matrix
print(____(ground_truth, preds))