ComeçarComece de graça

Criando dummies a partir de uma variável com muitas categorias

É dado um basetable com uma variável preditora "country". Garanta que "country" possa ser usada como variável preditora em um modelo de regressão logística criando variáveis dummies para ela.

Este exercício faz parte do curso

Análise Preditiva Intermediária em Python

Ver curso

Instruções do exercício

  • Crie um dataframe do pandas dummies_country que contenha as variáveis dummies para "country". Garanta que você evite multicolinearidade.
  • Adicione essas dummies ao basetable original.
  • Remova a variável original "country" do basetable.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Create the dummy variable
dummies_country = ____.____(____["____"], ____=____)

# Add the dummy variable to the basetable
basetable = ____.____([____, ____], ____=____)

# Delete the original variable from the basetable
____ ____["____"]
print(basetable.head())
Editar e executar o código