ComeçarComece de graça

Ajustando modelos logísticos

Muitos problemas de negócio exigem a previsão de uma variável resposta binária. Seu futuro empregador pode precisar detectar e-mails de spam, fraudes em cartões de crédito ou doenças raras.

O modelo de regressão logística é a abordagem ideal para problemas de classificação binária.

Neste exercício, você vai usar o conjunto de dados de Parkinson do repositório UCI. Esse conjunto reúne diversas medições biomédicas de voz de pessoas com e sem doença de Parkinson.

Você vai usar as seguintes variáveis do conjunto de dados:

  • status - 1 - se a pessoa tem doença de Parkinson, 0 - caso contrário,
  • NHR - uma medida da razão entre ruído e componentes tonais na voz,
  • DFA - um expoente de escala fractal do sinal.

O conjunto de dados está disponível como parkinsons.

Este exercício faz parte do curso

Praticando perguntas de entrevista de Estatística em R

Ver curso

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Plot status vs NHR
___(status ~ ___, data = ___)

# Plot status vs DFA
___(___ ~ ___, ___ = ___)
Editar e executar o código