Votação soft vs. hard

Agora você praticou a construção de dois tipos de métodos de ensemble: Voting e Averaging (votação soft). Qual é melhor? O ideal é testar ambos e comparar o desempenho. Vamos fazer isso agora usando o conjunto de dados de Game of Thrones.

Três classificadores individuais já foram instanciados para você:

Um DecisionTreeClassifier (clf_dt).
Um LogisticRegression (clf_lr).
Um KNeighborsClassifier (clf_knn).

Sua tarefa é testar tanto voting quanto averaging para determinar qual é melhor.

Este exercício faz parte do curso

Métodos de Ensemble em Python

Ver curso

Instruções do exercício

Prepare a lista de tuplas (string, estimator). Use 'dt' como rótulo para clf_dt, 'lr' para clf_lr e 'knn' para clf_knn.
Construa um classificador de votação chamado clf_vote.
Construa um classificador de média chamado clf_avg.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# List of (string, estimator) tuples
estimators = ____

# Build and fit a voting classifier
clf_vote = ____
clf_vote.fit(X_train, y_train)

# Build and fit an averaging classifier
clf_avg = ____
clf_avg.fit(X_train, y_train)

# Evaluate the performance of both models
acc_vote = accuracy_score(y_test, clf_vote.predict(X_test))
acc_avg = accuracy_score(y_test,  clf_avg.predict(X_test))
print('Voting: {:.2f}, Averaging: {:.2f}'.format(acc_vote, acc_avg))

Editar e executar o código