ComenzarEmpieza gratis

Modelado con variable categórica

En ejercicios anteriores ajustaste un modelo de regresión logística con color como variable explicativa junto con width, tratando color como variable cuantitativa. En este ejercicio vas a tratar color como una variable categórica que, al construir la matriz del modelo, codificará color en 3 variables con codificación 0/1.

Recuerda que la codificación predeterminada en dmatrix() usa el primer grupo como grupo de referencia. Para ver la matriz del modelo como un dataframe, se añadirá un argumento adicional en dmatrix(), concretamente return_type, con el valor 'dataframe'.

La variable color tiene un orden natural como sigue:
1: medium light
2: medium
3: medium dark
4: dark

El conjunto de datos crab está precargado en el área de trabajo.

Este ejercicio forma parte del curso

Modelos lineales generalizados en Python

Ver curso

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Construct model matrix
model_matrix = ____('C(____, ____(____))' , data = ____, 
                       return_type = 'dataframe')

# Print first 5 rows of model matrix dataframe
print(____.____)

# Fit and print the results of a glm model with the above model matrix configuration
model = ____('____ ~ ____(____, ____(____))', data = ____, 
            family = ____).____

print(____.____)
Editar y ejecutar código