Comece agoraComece grátis

Criando uma dummy a partir de uma variável com duas categorias

Você recebeu um basetable com uma variável preditora "gender". Garanta que "gender" possa ser usada como variável preditora em um modelo de regressão logística criando variáveis dummies para ela.

Este exercicio faz parte do curso

Análise Preditiva Intermediária em Python

Ver curso

Instruções do exercicio

  • Crie um dataframe do pandas dummies_gender com as variáveis dummies de "gender". Certifique-se de evitar multicolinearidade.
  • Adicione essas dummies ao basetable original.
  • Remova a variável original "gender" do basetable.

exercicio interativo prático

Tente este exercicio completando este código de exemplo.

# Create the dummy variable
dummies_gender = pd.____(____["____"], drop_first=____)

# Add the dummy variable to the basetable
basetable = pd.concat([____, ____], axis=1)

# Delete the original variable from the basetable
del basetable["____"]
print(basetable.head())
Editar e Executar Código