ComenzarEmpieza gratis

Codificación de rasgos categóricos

A veces, un conjunto de datos contiene valores numéricos que representan una característica categórica.

En el conjunto de datos donors, wealth_rating utiliza números para indicar el nivel de riqueza del donante:

  • 0 = Desconocido
  • 1 = Bajo
  • 2 = Medio
  • 3 = Alto

Este ejercicio ilustra cómo preparar este tipo de característica categórica y examina su impacto en un modelo de regresión logística. El marco de datos donors está disponible para que lo utilices.

Este ejercicio forma parte del curso

Aprendizaje supervisado en R: Clasificación

Ver curso

Instrucciones de ejercicio

  • Crea un factor wealth_levels a partir del numérico wealth_rating con etiquetas, como se muestra, pasando a la función factor() la columna que quieres convertir, los niveles individuales y las etiquetas.
  • Utiliza relevel() para cambiar la categoría de referencia a Medium. El primer argumento debe ser tu nueva columna factor.
  • Construye un modelo de regresión logística utilizando la columna wealth_levels para predecir donated y muestra el resultado con summary().

Ejercicio interactivo práctico

Pruebe este ejercicio completando este código de muestra.

# Convert the wealth rating to a factor
donors$wealth_levels <- ___(___, levels = ___, labels = ___)

# Use relevel() to change reference category
donors$wealth_levels <- ___(___, ref = ___)

# See how our factor coding impacts the model
summary(___)
Editar y ejecutar código