Contaminação no LoF
Sua consultora médica na startup de arritmia informa que seus dados de treino podem não conter todos os tipos possíveis de arritmia. Como, afinal, você vai detectar esses outros tipos sem nenhum exemplo rotulado? Será que um detector de anomalias consegue diferenciar entre saudável e não saudável sem acesso a rótulos? Antes disso, você vai experimentar o parâmetro de contaminação para ver seu efeito na matriz de confusão. Você tem LocalOutlierFactor como lof, numpy como np, os rótulos como ground_truth codificados em -1 e 1, exatamente como a saída do Local Outlier Factor, e os dados de treino não rotulados como X.
Este exercício faz parte do curso
Projetando Workflows de Machine Learning em Python
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Fit the local outlier factor and output predictions
preds = lof().____(X)
# Print the confusion matrix
print(____(ground_truth, preds))