Usar distintos conjuntos de variables
Añadir más variables y, por tanto, más complejidad a tu modelo de regresión logística no da automáticamente modelos más precisos. En este ejercicio puedes comprobar si añadir 3 variables a un modelo conduce a un modelo más preciso.
variables_1 y variables_2 están disponibles en tu entorno: puedes imprimirlas en la consola para ver cómo son.
Este ejercicio forma parte del curso
Introducción al análisis predictivo en Python
Instrucciones del ejercicio
- Ajusta el modelo
logregusandovariables_2, que contiene 3 variables adicionales en comparación convariables_1. - Realiza predicciones para este modelo.
- Calcula el AUC de este modelo.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Create appropriate DataFrames
X_1 = basetable[variables_1]
X_2 = basetable[variables_2]
y = basetable[["target"]]
# Create the logistic regression model
logreg = linear_model.LogisticRegression()
# Make predictions using the first set of variables and assign the AUC to auc_1
logreg.fit(X_1, y)
predictions_1 = logreg.predict_proba(X_1)[:,1]
auc_1 = roc_auc_score(y, predictions_1)
# Make predictions using the second set of variables and assign the AUC to auc_2
logreg.____(____, ____)
predictions_2 = ____.____(____)[____,____]
auc_2 = ____(____, ____)
# Print auc_1 and auc_2
print(round(auc_1,2))
print(round(auc_2,2))