Búsqueda del bosque óptimo
En este ejercicio, realizarás una búsqueda en cuadrícula utilizando la validación cruzada a 3 para encontrar los hiperparámetros óptimos de rf
. Para evaluar cada modelo de la parrilla, utilizarás la métrica del error cuadrático medio negativo.
Ten en cuenta que, como la búsqueda en cuadrícula es un proceso de búsqueda exhaustiva, puede llevar mucho tiempo entrenar el modelo. Aquí solo instanciarás el objeto GridSearchCV
sin ajustarlo al conjunto de entrenamiento. Como se explica en el vídeo, puedes entrenar un objeto de este tipo de forma similar a cualquier estimador de scikit-learn utilizando el método .fit()
:
grid_object.fit(X_train, y_train)
El modelo regresor de bosques aleatorios no sintonizados rf
, así como el diccionario params_rf
que definiste en el ejercicio anterior, están disponibles en tu espacio de trabajo.
Este ejercicio forma parte del curso
Machine learning con modelos basados en árboles en Python
Instrucciones de ejercicio
Importa
GridSearchCV
desdesklearn.model_selection
.Instancia un objeto
GridSearchCV
mediante CV a 3 utilizando el error cuadrático medio negativo como métrica de puntuación.
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Import GridSearchCV
____
# Instantiate grid_rf
grid_rf = ____(estimator=____,
param_grid=____,
scoring=____,
cv=____,
verbose=1,
n_jobs=-1)