Uso di insiemi di variabili diversi
Aggiungere più variabili e quindi più complessità al tuo modello di regressione logistica non porta automaticamente a modelli più accurati. In questo esercizio puoi verificare se aggiungere 3 variabili a un modello porta a un modello più preciso.
variables_1 e variables_2 sono disponibili nel tuo ambiente: puoi stamparle in console per vedere come sono fatte.
Questo esercizio fa parte del corso
Introduzione alla Predictive Analytics in Python
Istruzioni dell'esercizio
- Allena il modello
logregusandovariables_2, che contiene 3 variabili aggiuntive rispetto avariables_1. - Genera le previsioni per questo modello.
- Calcola l'AUC di questo modello.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Create appropriate DataFrames
X_1 = basetable[variables_1]
X_2 = basetable[variables_2]
y = basetable[["target"]]
# Create the logistic regression model
logreg = linear_model.LogisticRegression()
# Make predictions using the first set of variables and assign the AUC to auc_1
logreg.fit(X_1, y)
predictions_1 = logreg.predict_proba(X_1)[:,1]
auc_1 = roc_auc_score(y, predictions_1)
# Make predictions using the second set of variables and assign the AUC to auc_2
logreg.____(____, ____)
predictions_2 = ____.____(____)[____,____]
auc_2 = ____(____, ____)
# Print auc_1 and auc_2
print(round(auc_1,2))
print(round(auc_2,2))