Evaluación de clasificación
En la lección anterior, has creado un modelo logístico para predecir la enfermedad de Parkinson. En este ejercicio, compararás predicciones con valores reales.
Esta habilidad es fundamental porque las empresas se centran en los resultados. Los empleadores quieren saber cuán precisos son los modelos que desarrollas.
De nuevo, construirás un modelo para predecir el estado de la enfermedad de Parkinson. Esta vez, crearás el modelo con una parte del conjunto de datos y usarás el resto para pruebas.
Recuerda que \(\text{recall} = \frac{TP}{TP+FN}\).
\(TP\) significa que hemos predicho un valor positivo y hemos acertado.
\(FN\) significa que hemos predicho un valor negativo pero nos hemos equivocado.
Aproximadamente el 80% de las filas del conjunto de datos parkinsons se han asignado a train, y el resto se han asignado a test.
Este ejercicio forma parte del curso
Practicing Statistics Interview Questions in R
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Build a logistic model on the train data
model <- ___(___ ~ NHR + ___, data = ___, family = ___)
# Calculate probabilities for the test data
probabilities <- ___(___, newdata = ___, type = ___)