Codificando variáveis categóricas
Às vezes, um conjunto de dados contém valores numéricos que representam uma variável categórica.
No conjunto donors, wealth_rating usa números para indicar o nível de riqueza do doador:
- 0 = Unknown
- 1 = Low
- 2 = Medium
- 3 = High
Este exercício mostra como preparar esse tipo de variável categórica e analisa seu impacto em um modelo de regressão logística. O data frame donors está disponível para você usar.
Este exercício faz parte do curso
Aprendizagem supervisionada em R: Classificação
Instruções do exercício
- Crie um fator
wealth_levelsa partir dowealth_ratingnumérico com os rótulos mostrados, passando para a funçãofactor()a coluna que você quer converter, os níveis individuais e os rótulos. - Use
relevel()para alterar a categoria de referência paraMedium. O primeiro argumento deve ser sua nova colunafactor. - Construa um modelo de regressão logística usando a coluna
wealth_levelspara preverdonatede exiba o resultado comsummary().
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Convert the wealth rating to a factor
donors$wealth_levels <- ___(___, levels = ___, labels = ___)
# Use relevel() to change reference category
donors$wealth_levels <- ___(___, ref = ___)
# See how our factor coding impacts the model
summary(___)