Codificando variáveis categóricas
Nos exercícios anteriores, você praticou a criação de matrizes de modelo para variáveis contínuas e a aplicação de transformações de variáveis. Neste exercício, você vai praticar as formas de codificar uma variável categórica.
Dados categóricos permitem analisar e comparar relações considerando diferentes grupos ou fatores. Por isso, escolher um grupo de referência é importante e, dependendo do estudo, você pode querer trocar o grupo de referência padrão. Um motivo comum para mudar o grupo de referência é tornar a interpretação dos coeficientes mais aplicável e interessante para o contexto do estudo.
Neste exercício, você vai revisitar o conjunto de dados crab, em que color e spine são variáveis categóricas.
O conjunto de dados crab já está pré-carregado no workspace.
Este exercício faz parte do curso
Modelos Lineares Generalizados em Python
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Import function dmatrix
from ____ import ____
# Construct and print model matrix for color as categorical variable
print(____('____', data = ____,
return_type = 'dataframe').head())