Ajustando modelos logísticos
Muitos problemas de negócio exigem a previsão de uma variável resposta binária. Seu futuro empregador pode precisar detectar e-mails de spam, fraudes em cartões de crédito ou doenças raras.
O modelo de regressão logística é a abordagem ideal para problemas de classificação binária.
Neste exercício, você vai usar o conjunto de dados de Parkinson do repositório UCI. Esse conjunto reúne diversas medições biomédicas de voz de pessoas com e sem doença de Parkinson.
Você vai usar as seguintes variáveis do conjunto de dados:
status- 1 - se a pessoa tem doença de Parkinson, 0 - caso contrário,NHR- uma medida da razão entre ruído e componentes tonais na voz,DFA- um expoente de escala fractal do sinal.
O conjunto de dados está disponível como parkinsons.
Este exercício faz parte do curso
Praticando perguntas de entrevista de Estatística em R
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Plot status vs NHR
___(status ~ ___, data = ___)
# Plot status vs DFA
___(___ ~ ___, ___ = ___)