Codificación de rasgos categóricos
A veces, un conjunto de datos contiene valores numéricos que representan una característica categórica.
En el conjunto de datos donors
, wealth_rating
utiliza números para indicar el nivel de riqueza del donante:
- 0 = Desconocido
- 1 = Bajo
- 2 = Medio
- 3 = Alto
Este ejercicio ilustra cómo preparar este tipo de característica categórica y examina su impacto en un modelo de regresión logística. El marco de datos donors
está disponible para que lo utilices.
Este ejercicio forma parte del curso
Aprendizaje supervisado en R: Clasificación
Instrucciones de ejercicio
- Crea un factor
wealth_levels
a partir del numéricowealth_rating
con etiquetas, como se muestra, pasando a la funciónfactor()
la columna que quieres convertir, los niveles individuales y las etiquetas. - Utiliza
relevel()
para cambiar la categoría de referencia aMedium
. El primer argumento debe ser tu nueva columnafactor
. - Construye un modelo de regresión logística utilizando la columna
wealth_levels
para predecirdonated
y muestra el resultado consummary()
.
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Convert the wealth rating to a factor
donors$wealth_levels <- ___(___, levels = ___, labels = ___)
# Use relevel() to change reference category
donors$wealth_levels <- ___(___, ref = ___)
# See how our factor coding impacts the model
summary(___)