GridSearchCV com Scikit Learn
O módulo GridSearchCV do Scikit Learn oferece vários recursos úteis para ajudar a realizar uma grid search de forma eficiente. Agora você vai colocar o que aprendeu em prática, criando um objeto GridSearchCV com certos parâmetros.
As opções desejadas são:
- Um estimador Random Forest, com o critério de divisão como 'entropy'
- Validação cruzada com 5 dobras (5-fold)
- Os hiperparâmetros
max_depth(2, 4, 8, 15) emax_features('auto' vs 'sqrt') - Usar
roc_aucpara avaliar os modelos - Usar 4 núcleos para processamento em paralelo
- Garantir que você faça refit do melhor modelo e retorne as pontuações de treino
Você terá disponíveis os conjuntos de dados X_train, X_test, y_train e y_test.
Este exercício faz parte do curso
Ajuste de Hiperparâmetros em Python
Instruções do exercício
- Crie um estimador Random Forest conforme especificado no contexto acima.
- Crie uma grade de parâmetros conforme especificado no contexto acima.
- Crie um objeto
GridSearchCVcomo descrito no contexto acima, usando os dois elementos criados nas duas instruções anteriores.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Create a Random Forest Classifier with specified criterion
rf_class = RandomForestClassifier(____=____)
# Create the parameter grid
param_grid = {____: ____, ____: ____}
# Create a GridSearchCV object
grid_rf_class = GridSearchCV(
estimator=____,
param_grid=____,
scoring=____,
n_jobs=____,
cv=____,
refit=____, return_train_score=____)
print(grid_rf_class)