ComenzarEmpieza gratis

Prueba con otro umbral

En los ejercicios anteriores, usaste un umbral de 0.50 para cortar las probabilidades predichas y así hacer predicciones de clase (roca vs mina). Sin embargo, este umbral de clasificación no siempre se ajusta a los objetivos de un problema de modelado concreto.

Por ejemplo, imagina que quieres identificar los objetos de los que estás realmente seguro de que son minas. En ese caso, podrías usar un umbral de probabilidad de 0.90 para obtener menos minas predichas, pero con mayor confianza en cada predicción.

El patrón de código para convertir probabilidades en clases predichas y luego calcular una matriz de confusión se mostró en el Ejercicio 7 de este capítulo.

Este ejercicio forma parte del curso

Machine Learning con caret en R

Ver curso

Instrucciones del ejercicio

  • Usa ifelse() para crear un vector de caracteres, m_or_r, que sea la clase positiva, "M", cuando p sea mayor que 0.9, y la clase negativa, "R", en caso contrario.
  • Convierte m_or_r en un factor, p_class, con los mismos niveles que test[["Class"]].
  • Crea una matriz de confusión con confusionMatrix(), pasando p_class y la columna "Class" del conjunto test.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# If p exceeds threshold of 0.9, M else R: m_or_r


# Convert to factor: p_class


# Create confusion matrix
Editar y ejecutar código