ComeçarComece de graça

GridSearchCV com Scikit Learn

O módulo GridSearchCV do Scikit Learn oferece vários recursos úteis para ajudar a realizar uma grid search de forma eficiente. Agora você vai colocar o que aprendeu em prática, criando um objeto GridSearchCV com certos parâmetros.

As opções desejadas são:

  • Um estimador Random Forest, com o critério de divisão como 'entropy'
  • Validação cruzada com 5 dobras (5-fold)
  • Os hiperparâmetros max_depth (2, 4, 8, 15) e max_features ('auto' vs 'sqrt')
  • Usar roc_auc para avaliar os modelos
  • Usar 4 núcleos para processamento em paralelo
  • Garantir que você faça refit do melhor modelo e retorne as pontuações de treino

Você terá disponíveis os conjuntos de dados X_train, X_test, y_train e y_test.

Este exercício faz parte do curso

Ajuste de Hiperparâmetros em Python

Ver curso

Instruções do exercício

  • Crie um estimador Random Forest conforme especificado no contexto acima.
  • Crie uma grade de parâmetros conforme especificado no contexto acima.
  • Crie um objeto GridSearchCV como descrito no contexto acima, usando os dois elementos criados nas duas instruções anteriores.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Create a Random Forest Classifier with specified criterion
rf_class = RandomForestClassifier(____=____)

# Create the parameter grid
param_grid = {____: ____, ____: ____} 

# Create a GridSearchCV object
grid_rf_class = GridSearchCV(
    estimator=____,
    param_grid=____,
    scoring=____,
    n_jobs=____,
    cv=____,
    refit=____, return_train_score=____)
print(grid_rf_class)
Editar e executar o código