ComeçarComece de graça

Ajustando hiperparâmetros do bagging

Embora você possa facilmente construir um classificador de bagging usando os parâmetros padrão, é altamente recomendado ajustá-los para obter o desempenho ideal. O ideal é otimizar esses parâmetros usando validação cruzada K-fold.

Neste exercício, vamos ver se conseguimos melhorar o desempenho do modelo modificando os parâmetros do classificador de bagging.

Aqui também estamos passando o parâmetro solver='liblinear' para LogisticRegression para reduzir o tempo de computação.

Este exercício faz parte do curso

Métodos de Ensemble em Python

Ver curso

Instruções do exercício

  • Construa um classificador de bagging tendo como base a regressão logística, com 20 estimadores base, 10 recursos máximos (max_features), 0.65 (65%) de amostras máximas (max_samples) e amostragem sem reposição.
  • Use clf_bag para prever os rótulos do conjunto de teste, X_test.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Build a balanced logistic regression
clf_base = LogisticRegression(class_weight='balanced', solver='liblinear', random_state=42)

# Build and fit a bagging classifier with custom parameters
clf_bag = ____(____, ____, ____, ____, ____, random_state=500)
clf_bag.fit(X_train, y_train)

# Calculate predictions and evaluate the accuracy on the test set
y_pred = ____
print('Accuracy:  {:.2f}'.format(accuracy_score(y_test, y_pred)))

# Print the classification report
print(classification_report(y_test, y_pred))
Editar e executar o código