ComenzarEmpieza gratis

Usar distintos conjuntos de variables

Añadir más variables y, por tanto, más complejidad a tu modelo de regresión logística no da automáticamente modelos más precisos. En este ejercicio puedes comprobar si añadir 3 variables a un modelo conduce a un modelo más preciso.

variables_1 y variables_2 están disponibles en tu entorno: puedes imprimirlas en la consola para ver cómo son.

Este ejercicio forma parte del curso

Introducción al análisis predictivo en Python

Ver curso

Instrucciones del ejercicio

  • Ajusta el modelo logreg usando variables_2, que contiene 3 variables adicionales en comparación con variables_1.
  • Realiza predicciones para este modelo.
  • Calcula el AUC de este modelo.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Create appropriate DataFrames
X_1 = basetable[variables_1]
X_2 = basetable[variables_2]
y = basetable[["target"]]

# Create the logistic regression model
logreg = linear_model.LogisticRegression()

# Make predictions using the first set of variables and assign the AUC to auc_1
logreg.fit(X_1, y)
predictions_1 = logreg.predict_proba(X_1)[:,1]
auc_1 = roc_auc_score(y, predictions_1)

# Make predictions using the second set of variables and assign the AUC to auc_2
logreg.____(____, ____)
predictions_2 = ____.____(____)[____,____]
auc_2 = ____(____, ____)

# Print auc_1 and auc_2
print(round(auc_1,2))
print(round(auc_2,2))
Editar y ejecutar código