Modelagem com variável categórica
Nos exercícios anteriores, você ajustou um modelo de regressão logística com color como variável explicativa junto com width, tratando color como variável quantitativa. Neste exercício, você vai tratar color como uma variável categórica que, ao construir a matriz do modelo, codificará color em 3 variáveis com codificação 0/1.
Lembre-se de que a codificação padrão em dmatrix() usa o primeiro grupo como grupo de referência. Para visualizar a matriz do modelo como um dataframe, um argumento adicional em dmatrix(), chamado return_type, deve ser definido como 'dataframe'.
A variável color tem uma ordenação natural da seguinte forma:
1: medium light
2: medium
3: medium dark
4: dark
O conjunto de dados crab já está pré-carregado no ambiente de trabalho.
Este exercício faz parte do curso
Modelos Lineares Generalizados em Python
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Construct model matrix
model_matrix = ____('C(____, ____(____))' , data = ____,
return_type = 'dataframe')
# Print first 5 rows of model matrix dataframe
print(____.____)
# Fit and print the results of a glm model with the above model matrix configuration
model = ____('____ ~ ____(____, ____(____))', data = ____,
family = ____).____
print(____.____)