Prueba con otro umbral
En los ejercicios anteriores, usaste un umbral de 0.50 para cortar las probabilidades predichas y así hacer predicciones de clase (roca vs mina). Sin embargo, este umbral de clasificación no siempre se ajusta a los objetivos de un problema de modelado concreto.
Por ejemplo, imagina que quieres identificar los objetos de los que estás realmente seguro de que son minas. En ese caso, podrías usar un umbral de probabilidad de 0.90 para obtener menos minas predichas, pero con mayor confianza en cada predicción.
El patrón de código para convertir probabilidades en clases predichas y luego calcular una matriz de confusión se mostró en el Ejercicio 7 de este capítulo.
Este ejercicio forma parte del curso
Machine Learning con caret en R
Instrucciones del ejercicio
- Usa
ifelse()para crear un vector de caracteres,m_or_r, que sea la clase positiva,"M", cuandopsea mayor que 0.9, y la clase negativa,"R", en caso contrario. - Convierte
m_or_ren un factor,p_class, con los mismos niveles quetest[["Class"]]. - Crea una matriz de confusión con
confusionMatrix(), pasandop_classy la columna"Class"del conjuntotest.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# If p exceeds threshold of 0.9, M else R: m_or_r
# Convert to factor: p_class
# Create confusion matrix