Avaliação de classificação
Na lição anterior, você construiu um modelo logístico para prever a doença de Parkinson. Neste exercício, você vai comparar previsões com valores reais.
Essa habilidade é essencial porque as empresas focam nos resultados. Empregadores querem saber quão precisos são os modelos que você desenvolve.
Mais uma vez, você vai construir um modelo para prever o status da doença de Parkinson. Desta vez, você vai ajustar o modelo em parte do conjunto de dados e usar o restante para teste.
Lembre-se de que \(\text{recall} = \frac{TP}{TP+FN}\).
\(TP\) significa que previmos um valor positivo e estávamos certos.
\(FN\) significa que previmos um valor negativo, mas estávamos errados.
Cerca de 80% das linhas do conjunto de dados parkinsons foram atribuídas a train, e o restante foi atribuído a test.
Este exercício faz parte do curso
Praticando perguntas de entrevista de Estatística em R
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Build a logistic model on the train data
model <- ___(___ ~ NHR + ___, data = ___, family = ___)
# Calculate probabilities for the test data
probabilities <- ___(___, newdata = ___, type = ___)