Evalúa el árbol óptimo
En este ejercicio, evaluarás la puntuación del conjunto de pruebas ROC AUC del modelo óptimo de grid_dt
.
Para ello, primero determinarás la probabilidad de obtener la etiqueta positiva para cada observación del conjunto de pruebas. Puedes utilizar el métodopredict_proba()
de un clasificador sklearn para calcular una matriz 2D que contenga las probabilidades de las etiquetas de clase negativa y positiva respectivamente a lo largo de las columnas.
El conjunto de datos ya está cargado y procesado para ti (las características numéricas están normalizadas); está dividido en un 80 % de entrenamiento y un 20 % de prueba. X_test
, y_test
están disponibles en tu espacio de trabajo. Además, también hemos cargado el objeto GridSearchCV
entrenado grid_dt
que instanciaste en el ejercicio anterior. Ten en cuenta que grid_dt
se entrenó del siguiente modo:
grid_dt.fit(X_train, y_train)
Este ejercicio forma parte del curso
Machine learning con modelos basados en árboles en Python
Instrucciones de ejercicio
Importa
roc_auc_score
desdesklearn.metrics
.Extrae el atributo
.best_estimator_
degrid_dt
y asígnalo abest_model
.Predice las probabilidades del conjunto de pruebas de obtener la clase positiva
y_pred_proba
.Calcula la puntuación del conjunto de pruebas ROC AUC
test_roc_auc
debest_model
.
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Import roc_auc_score from sklearn.metrics
____
# Extract the best estimator
best_model = ____
# Predict the test set probabilities of the positive class
y_pred_proba = ____
# Compute test_roc_auc
test_roc_auc = ____
# Print test_roc_auc
print('Test set ROC AUC score: {:.3f}'.format(test_roc_auc))