Ajustando hiperparâmetros do bagging
Embora você possa facilmente construir um classificador de bagging usando os parâmetros padrão, é altamente recomendado ajustá-los para obter o desempenho ideal. O ideal é otimizar esses parâmetros usando validação cruzada K-fold.
Neste exercício, vamos ver se conseguimos melhorar o desempenho do modelo modificando os parâmetros do classificador de bagging.
Aqui também estamos passando o parâmetro solver='liblinear' para LogisticRegression para reduzir o tempo de computação.
Este exercício faz parte do curso
Métodos de Ensemble em Python
Instruções do exercício
- Construa um classificador de bagging tendo como base a regressão logística, com
20estimadores base,10recursos máximos (max_features),0.65(65%) de amostras máximas (max_samples) e amostragem sem reposição. - Use
clf_bagpara prever os rótulos do conjunto de teste,X_test.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Build a balanced logistic regression
clf_base = LogisticRegression(class_weight='balanced', solver='liblinear', random_state=42)
# Build and fit a bagging classifier with custom parameters
clf_bag = ____(____, ____, ____, ____, ____, random_state=500)
clf_bag.fit(X_train, y_train)
# Calculate predictions and evaluate the accuracy on the test set
y_pred = ____
print('Accuracy: {:.2f}'.format(accuracy_score(y_test, y_pred)))
# Print the classification report
print(classification_report(y_test, y_pred))