ComenzarEmpieza gratis

Búsqueda del árbol óptimo

En este ejercicio, realizarás una búsqueda en cuadrícula utilizando una validación cruzada a 5 para encontrar los hiperparámetros óptimos de dt. Ten en cuenta que, como la búsqueda en la cuadrícula es un proceso exhaustivo, puede llevar mucho tiempo entrenar el modelo. Aquí solo instanciarás el objeto GridSearchCV sin ajustarlo al conjunto de entrenamiento. Como se explica en el vídeo, puedes entrenar un objeto de este tipo de forma similar a cualquier estimador de scikit-learn utilizando el método .fit():

grid_object.fit(X_train, y_train)

Un árbol de clasificación sin afinar dt, así como el diccionario params_dt que definiste en el ejercicio anterior, están disponibles en tu espacio de trabajo.

Este ejercicio forma parte del curso

Machine learning con modelos basados en árboles en Python

Ver curso

Instrucciones del ejercicio

  • Importa GridSearchCV desde sklearn.model_selection.

  • Instancia un objeto GridSearchCV utilizando CV a 5 estableciendo los parámetros:

    • estimator a dt, param_grid a params_dt y

    • scoring a 'roc_auc'.

Ejercicio interactivo práctico

Prueba este ejercicio completando el código de muestra.

# Import GridSearchCV
____

# Instantiate grid_dt
grid_dt = ____(estimator=____,
                       param_grid=____,
                       scoring=____,
                       cv=____,
                       n_jobs=-1)
Editar y ejecutar código