Búsqueda del árbol óptimo
En este ejercicio, realizarás una búsqueda en cuadrícula utilizando una validación cruzada a 5 para encontrar los hiperparámetros óptimos de dt. Ten en cuenta que, como la búsqueda en la cuadrícula es un proceso exhaustivo, puede llevar mucho tiempo entrenar el modelo. Aquí solo instanciarás el objeto GridSearchCV sin ajustarlo al conjunto de entrenamiento. Como se explica en el vídeo, puedes entrenar un objeto de este tipo de forma similar a cualquier estimador de scikit-learn utilizando el método .fit():
grid_object.fit(X_train, y_train)
Un árbol de clasificación sin afinar dt, así como el diccionario params_dt que definiste en el ejercicio anterior, están disponibles en tu espacio de trabajo.
Este ejercicio forma parte del curso
Machine learning con modelos basados en árboles en Python
Instrucciones del ejercicio
Importa
GridSearchCVdesdesklearn.model_selection.Instancia un objeto
GridSearchCVutilizando CV a 5 estableciendo los parámetros:estimatoradt,param_gridaparams_dtyscoringa'roc_auc'.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Import GridSearchCV
____
# Instantiate grid_dt
grid_dt = ____(estimator=____,
param_grid=____,
scoring=____,
cv=____,
n_jobs=-1)