Experimente outro limiar
Nos exercícios anteriores, você usou um limiar de 0,50 para cortar suas probabilidades previstas e gerar previsões de classe (rocha vs mina). No entanto, esse limiar de classificação nem sempre está alinhado com os objetivos de um determinado problema de modelagem.
Por exemplo, imagine que você quer identificar os objetos de que você tem muita certeza de que são minas. Nesse caso, pode ser interessante usar um limiar de probabilidade de 0,90 para obter menos minas previstas, mas com maior confiança em cada previsão.
O padrão de código para cortar probabilidades em classes previstas e depois calcular uma matriz de confusão foi mostrado no Exercício 7 deste capítulo.
Este exercício faz parte do curso
Machine Learning com caret em R
Instruções do exercício
- Use
ifelse()para criar um vetor de caracteres,m_or_r, que seja a classe positiva,"M", quandopfor maior que 0.9, e a classe negativa,"R", caso contrário. - Converta
m_or_rem um fator,p_class, com níveis iguais aos detest[["Class"]]. - Crie uma matriz de confusão com
confusionMatrix(), passandop_classe a coluna"Class"do conjunto de dadostest.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# If p exceeds threshold of 0.9, M else R: m_or_r
# Convert to factor: p_class
# Create confusion matrix