ComenzarEmpieza gratis

Codificar variables categóricas

A veces un conjunto de datos contiene valores numéricos que representan una variable categórica.

En el conjunto donors, wealth_rating usa números para indicar el nivel de riqueza del donante:

  • 0 = Desconocido
  • 1 = Bajo
  • 2 = Medio
  • 3 = Alto

Este ejercicio muestra cómo preparar este tipo de variable categórica y analiza su impacto en un modelo de regresión logística. El data frame donors está disponible para que lo uses.

Este ejercicio forma parte del curso

Aprendizaje supervisado en R: Clasificación

Ver curso

Instrucciones del ejercicio

  • Crea un factor wealth_levels a partir del numérico wealth_rating con las etiquetas indicadas, pasando a la función factor() la columna que quieres convertir, los niveles individuales y las etiquetas.
  • Usa relevel() para cambiar la categoría de referencia a Medium. El primer argumento debe ser tu nueva columna factor.
  • Construye un modelo de regresión logística usando la columna wealth_levels para predecir donated y muestra el resultado con summary().

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Convert the wealth rating to a factor
donors$wealth_levels <- ___(___, levels = ___, labels = ___)

# Use relevel() to change reference category
donors$wealth_levels <- ___(___, ref = ___)

# See how our factor coding impacts the model
summary(___)
Editar y ejecutar código