Usando conjuntos diferentes de variáveis
Adicionar mais variáveis — e, portanto, mais complexidade — ao seu modelo de regressão logística não resulta automaticamente em modelos mais precisos. Neste exercício, você vai verificar se adicionar 3 variáveis a um modelo leva a um modelo mais preciso.
variables_1 e variables_2 estão disponíveis no seu ambiente: você pode imprimi-las no console para ver como são.
Este exercício faz parte do curso
Introdução à Análise Preditiva em Python
Instruções do exercício
- Ajuste o modelo
logregusandovariables_2, que contém 3 variáveis adicionais em comparação comvariables_1. - Faça previsões para esse modelo.
- Calcule a AUC desse modelo.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Create appropriate DataFrames
X_1 = basetable[variables_1]
X_2 = basetable[variables_2]
y = basetable[["target"]]
# Create the logistic regression model
logreg = linear_model.LogisticRegression()
# Make predictions using the first set of variables and assign the AUC to auc_1
logreg.fit(X_1, y)
predictions_1 = logreg.predict_proba(X_1)[:,1]
auc_1 = roc_auc_score(y, predictions_1)
# Make predictions using the second set of variables and assign the AUC to auc_2
logreg.____(____, ____)
predictions_2 = ____.____(____)[____,____]
auc_2 = ____(____, ____)
# Print auc_1 and auc_2
print(round(auc_1,2))
print(round(auc_2,2))