Codificación de variables categóricas
En ejercicios anteriores practicaste cómo crear matrices de diseño para variables continuas y aplicar transformaciones de variables. En este ejercicio vas a practicar distintas formas de codificar una variable categórica.
Los datos categóricos permiten analizar y comparar relaciones según diferentes grupos o factores. Por ello, elegir un grupo de referencia es importante y, según el estudio, puede que quieras cambiar el grupo de referencia respecto al predeterminado. Un motivo frecuente para cambiarlo es que la interpretación de los coeficientes estimados resulte más útil e interesante para el estudio.
En este ejercicio volverás al conjunto de datos crab, donde color y spine son variables categóricas.
El conjunto de datos crab está precargado en el espacio de trabajo.
Este ejercicio forma parte del curso
Modelos lineales generalizados en Python
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Import function dmatrix
from ____ import ____
# Construct and print model matrix for color as categorical variable
print(____('____', data = ____,
return_type = 'dataframe').head())