Criando uma dummy a partir de uma variável com duas categorias
Você recebeu um basetable com uma variável preditora "gender". Garanta que "gender" possa ser usada como variável preditora em um modelo de regressão logística criando variáveis dummies para ela.
Este exercício faz parte do curso
Análise Preditiva Intermediária em Python
Instruções do exercício
- Crie um dataframe do pandas
dummies_gendercom as variáveis dummies de "gender". Certifique-se de evitar multicolinearidade. - Adicione essas dummies ao
basetableoriginal. - Remova a variável original "gender" do
basetable.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Create the dummy variable
dummies_gender = pd.____(____["____"], drop_first=____)
# Add the dummy variable to the basetable
basetable = pd.concat([____, ____], axis=1)
# Delete the original variable from the basetable
del basetable["____"]
print(basetable.head())