Modelado con variable categórica
En ejercicios anteriores ajustaste un modelo de regresión logística con color como variable explicativa junto con width, tratando color como variable cuantitativa. En este ejercicio vas a tratar color como una variable categórica que, al construir la matriz del modelo, codificará color en 3 variables con codificación 0/1.
Recuerda que la codificación predeterminada en dmatrix() usa el primer grupo como grupo de referencia. Para ver la matriz del modelo como un dataframe, se añadirá un argumento adicional en dmatrix(), concretamente return_type, con el valor 'dataframe'.
La variable color tiene un orden natural como sigue:
1: medium light
2: medium
3: medium dark
4: dark
El conjunto de datos crab está precargado en el área de trabajo.
Este ejercicio forma parte del curso
Modelos lineales generalizados en Python
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Construct model matrix
model_matrix = ____('C(____, ____(____))' , data = ____,
return_type = 'dataframe')
# Print first 5 rows of model matrix dataframe
print(____.____)
# Fit and print the results of a glm model with the above model matrix configuration
model = ____('____ ~ ____(____, ____(____))', data = ____,
family = ____).____
print(____.____)