ComeçarComece de graça

Codificando variáveis categóricas

Às vezes, um conjunto de dados contém valores numéricos que representam uma variável categórica.

No conjunto donors, wealth_rating usa números para indicar o nível de riqueza do doador:

  • 0 = Unknown
  • 1 = Low
  • 2 = Medium
  • 3 = High

Este exercício mostra como preparar esse tipo de variável categórica e analisa seu impacto em um modelo de regressão logística. O data frame donors está disponível para você usar.

Este exercício faz parte do curso

Aprendizagem supervisionada em R: Classificação

Ver curso

Instruções do exercício

  • Crie um fator wealth_levels a partir do wealth_rating numérico com os rótulos mostrados, passando para a função factor() a coluna que você quer converter, os níveis individuais e os rótulos.
  • Use relevel() para alterar a categoria de referência para Medium. O primeiro argumento deve ser sua nova coluna factor.
  • Construa um modelo de regressão logística usando a coluna wealth_levels para prever donated e exiba o resultado com summary().

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Convert the wealth rating to a factor
donors$wealth_levels <- ___(___, levels = ___, labels = ___)

# Use relevel() to change reference category
donors$wealth_levels <- ___(___, ref = ___)

# See how our factor coding impacts the model
summary(___)
Editar e executar o código