Búsqueda del árbol óptimo
En este ejercicio, realizarás una búsqueda en cuadrícula utilizando una validación cruzada a 5 para encontrar los hiperparámetros óptimos de dt
. Ten en cuenta que, como la búsqueda en la cuadrícula es un proceso exhaustivo, puede llevar mucho tiempo entrenar el modelo. Aquí solo instanciarás el objeto GridSearchCV
sin ajustarlo al conjunto de entrenamiento. Como se explica en el vídeo, puedes entrenar un objeto de este tipo de forma similar a cualquier estimador de scikit-learn utilizando el método .fit()
:
grid_object.fit(X_train, y_train)
Un árbol de clasificación sin afinar dt
, así como el diccionario params_dt
que definiste en el ejercicio anterior, están disponibles en tu espacio de trabajo.
Este ejercicio forma parte del curso
Machine learning con modelos basados en árboles en Python
Instrucciones del ejercicio
Importa
GridSearchCV
desdesklearn.model_selection
.Instancia un objeto
GridSearchCV
utilizando CV a 5 estableciendo los parámetros:estimator
adt
,param_grid
aparams_dt
yscoring
a'roc_auc'
.
Ejercicio interactivo práctico
Prueba este ejercicio completando el código de muestra.
# Import GridSearchCV
____
# Instantiate grid_dt
grid_dt = ____(estimator=____,
param_grid=____,
scoring=____,
cv=____,
n_jobs=-1)