Votação soft vs. hard
Agora você praticou a construção de dois tipos de métodos de ensemble: Voting e Averaging (votação soft). Qual é melhor? O ideal é testar ambos e comparar o desempenho. Vamos fazer isso agora usando o conjunto de dados de Game of Thrones.
Três classificadores individuais já foram instanciados para você:
- Um
DecisionTreeClassifier(clf_dt). - Um
LogisticRegression(clf_lr). - Um
KNeighborsClassifier(clf_knn).
Sua tarefa é testar tanto voting quanto averaging para determinar qual é melhor.
Este exercício faz parte do curso
Métodos de Ensemble em Python
Instruções do exercício
- Prepare a lista de tuplas
(string, estimator). Use'dt'como rótulo paraclf_dt,'lr'paraclf_lre'knn'paraclf_knn. - Construa um classificador de votação chamado
clf_vote. - Construa um classificador de média chamado
clf_avg.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# List of (string, estimator) tuples
estimators = ____
# Build and fit a voting classifier
clf_vote = ____
clf_vote.fit(X_train, y_train)
# Build and fit an averaging classifier
clf_avg = ____
clf_avg.fit(X_train, y_train)
# Evaluate the performance of both models
acc_vote = accuracy_score(y_test, clf_vote.predict(X_test))
acc_avg = accuracy_score(y_test, clf_avg.predict(X_test))
print('Voting: {:.2f}, Averaging: {:.2f}'.format(acc_vote, acc_avg))