Evalúa el árbol óptimo
En este ejercicio, evaluarás la puntuación del conjunto de pruebas ROC AUC del modelo óptimo de grid_dt.
Para ello, primero determinarás la probabilidad de obtener la etiqueta positiva para cada observación del conjunto de pruebas. Puedes utilizar el métodopredict_proba() de un clasificador sklearn para calcular una matriz 2D que contenga las probabilidades de las etiquetas de clase negativa y positiva respectivamente a lo largo de las columnas.
El conjunto de datos ya está cargado y procesado para ti (las características numéricas están normalizadas); está dividido en un 80 % de entrenamiento y un 20 % de prueba. X_test, y_test están disponibles en tu espacio de trabajo. Además, también hemos cargado el objeto GridSearchCV entrenado grid_dt que instanciaste en el ejercicio anterior. Ten en cuenta que grid_dt se entrenó del siguiente modo:
grid_dt.fit(X_train, y_train)
Este ejercicio forma parte del curso
Machine learning con modelos basados en árboles en Python
Instrucciones del ejercicio
Importa
roc_auc_scoredesdesklearn.metrics.Extrae el atributo
.best_estimator_degrid_dty asígnalo abest_model.Predice las probabilidades del conjunto de pruebas de obtener la clase positiva
y_pred_proba.Calcula la puntuación del conjunto de pruebas ROC AUC
test_roc_aucdebest_model.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Import roc_auc_score from sklearn.metrics
____
# Extract the best estimator
best_model = ____
# Predict the test set probabilities of the positive class
y_pred_proba = ____
# Compute test_roc_auc
test_roc_auc = ____
# Print test_roc_auc
print('Test set ROC AUC score: {:.3f}'.format(test_roc_auc))