ComeçarComece de graça

Contaminação no LoF

Sua consultora médica na startup de arritmia informa que seus dados de treino podem não conter todos os tipos possíveis de arritmia. Como, afinal, você vai detectar esses outros tipos sem nenhum exemplo rotulado? Será que um detector de anomalias consegue diferenciar entre saudável e não saudável sem acesso a rótulos? Antes disso, você vai experimentar o parâmetro de contaminação para ver seu efeito na matriz de confusão. Você tem LocalOutlierFactor como lof, numpy como np, os rótulos como ground_truth codificados em -1 e 1, exatamente como a saída do Local Outlier Factor, e os dados de treino não rotulados como X.

Este exercício faz parte do curso

Projetando Workflows de Machine Learning em Python

Ver curso

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Fit the local outlier factor and output predictions
preds = lof().____(X)

# Print the confusion matrix
print(____(ground_truth, preds))
Editar e executar o código