ComeçarComece de graça

Usando conjuntos diferentes de variáveis

Adicionar mais variáveis — e, portanto, mais complexidade — ao seu modelo de regressão logística não resulta automaticamente em modelos mais precisos. Neste exercício, você vai verificar se adicionar 3 variáveis a um modelo leva a um modelo mais preciso.

variables_1 e variables_2 estão disponíveis no seu ambiente: você pode imprimi-las no console para ver como são.

Este exercício faz parte do curso

Introdução à Análise Preditiva em Python

Ver curso

Instruções do exercício

  • Ajuste o modelo logreg usando variables_2, que contém 3 variáveis adicionais em comparação com variables_1.
  • Faça previsões para esse modelo.
  • Calcule a AUC desse modelo.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Create appropriate DataFrames
X_1 = basetable[variables_1]
X_2 = basetable[variables_2]
y = basetable[["target"]]

# Create the logistic regression model
logreg = linear_model.LogisticRegression()

# Make predictions using the first set of variables and assign the AUC to auc_1
logreg.fit(X_1, y)
predictions_1 = logreg.predict_proba(X_1)[:,1]
auc_1 = roc_auc_score(y, predictions_1)

# Make predictions using the second set of variables and assign the AUC to auc_2
logreg.____(____, ____)
predictions_2 = ____.____(____)[____,____]
auc_2 = ____(____, ____)

# Print auc_1 and auc_2
print(round(auc_1,2))
print(round(auc_2,2))
Editar e executar o código