Evalúa el árbol óptimo

En este ejercicio, evaluarás la puntuación ROC AUC del conjunto de pruebas del modelo óptimo de grid_dt.

Para ello, primero determinarás la probabilidad de obtener la etiqueta positiva para cada observación del conjunto de pruebas. Puedes utilizar el métodopredict_proba() de un clasificador sklearn para calcular una matriz 2D que contenga las probabilidades de las etiquetas de clase negativa y positiva respectivamente a lo largo de las columnas.

El conjunto de datos ya está cargado y procesado para ti (las características numéricas están normalizadas); está dividido en un 80% de entrenamiento y un 20% de prueba. X_test, y_test están disponibles en tu espacio de trabajo. Además, también hemos cargado el objeto GridSearchCV entrenado grid_dt que instanciaste en el ejercicio anterior. Ten en cuenta que grid_dt se entrenó del siguiente modo:

grid_dt.fit(X_train, y_train)

Importa roc_auc_score desde sklearn.metrics.
Extrae el atributo .best_estimator_ de grid_dt y asígnalo a best_model.
Predice las probabilidades del conjunto de pruebas de obtener la clase positiva y_pred_proba.
Calcula la puntuación ROC AUC del conjunto de pruebas test_roc_auc de best_model.

Árboles de clasificación y regresión

El equilibrio entre sesgo y varianza

Sacos y bosques aleatorios

Aumentar

Ajuste del modelo

Ejercicio

Evalúa el árbol óptimo

Instrucciones