ComeçarComece de graça

Codificando variáveis categóricas

Nos exercícios anteriores, você praticou a criação de matrizes de modelo para variáveis contínuas e a aplicação de transformações de variáveis. Neste exercício, você vai praticar as formas de codificar uma variável categórica.

Dados categóricos permitem analisar e comparar relações considerando diferentes grupos ou fatores. Por isso, escolher um grupo de referência é importante e, dependendo do estudo, você pode querer trocar o grupo de referência padrão. Um motivo comum para mudar o grupo de referência é tornar a interpretação dos coeficientes mais aplicável e interessante para o contexto do estudo.

Neste exercício, você vai revisitar o conjunto de dados crab, em que color e spine são variáveis categóricas.

O conjunto de dados crab já está pré-carregado no workspace.

Este exercício faz parte do curso

Modelos Lineares Generalizados em Python

Ver curso

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Import function dmatrix
from ____ import ____

# Construct and print model matrix for color as categorical variable
print(____('____', data = ____,
     	   return_type = 'dataframe').head())
Editar e executar o código