ComenzarEmpieza gratis

Evalúa el árbol óptimo

En este ejercicio, evaluarás la puntuación del conjunto de pruebas ROC AUC del modelo óptimo de grid_dt.

Para ello, primero determinarás la probabilidad de obtener la etiqueta positiva para cada observación del conjunto de pruebas. Puedes utilizar el métodopredict_proba() de un clasificador sklearn para calcular una matriz 2D que contenga las probabilidades de las etiquetas de clase negativa y positiva respectivamente a lo largo de las columnas.

El conjunto de datos ya está cargado y procesado para ti (las características numéricas están normalizadas); está dividido en un 80 % de entrenamiento y un 20 % de prueba. X_test, y_test están disponibles en tu espacio de trabajo. Además, también hemos cargado el objeto GridSearchCV entrenado grid_dt que instanciaste en el ejercicio anterior. Ten en cuenta que grid_dt se entrenó del siguiente modo:

grid_dt.fit(X_train, y_train)

Este ejercicio forma parte del curso

Machine learning con modelos basados en árboles en Python

Ver curso

Instrucciones de ejercicio

  • Importa roc_auc_score desde sklearn.metrics.

  • Extrae el atributo .best_estimator_ de grid_dt y asígnalo a best_model.

  • Predice las probabilidades del conjunto de pruebas de obtener la clase positiva y_pred_proba.

  • Calcula la puntuación del conjunto de pruebas ROC AUC test_roc_auc de best_model.

Ejercicio interactivo práctico

Pruebe este ejercicio completando este código de muestra.

# Import roc_auc_score from sklearn.metrics
____

# Extract the best estimator
best_model = ____

# Predict the test set probabilities of the positive class
y_pred_proba = ____

# Compute test_roc_auc
test_roc_auc = ____

# Print test_roc_auc
print('Test set ROC AUC score: {:.3f}'.format(test_roc_auc))
Editar y ejecutar código