Vote souple vs. vote dur
Vous avez maintenant pratiqué deux types de méthodes d’ensemble : le vote et la moyenne (vote souple). Lequel est le meilleur ? Le mieux est d’essayer les deux, puis de comparer leurs performances. Testons cela maintenant avec le jeu de données Game of Thrones.
Trois classifieurs individuels ont été instanciés pour vous :
- Un
DecisionTreeClassifier(clf_dt). - Une
LogisticRegression(clf_lr). - Un
KNeighborsClassifier(clf_knn).
Votre tâche est d’essayer à la fois le vote et la moyenne pour déterminer lequel fonctionne le mieux.
Cet exercice fait partie du cours
Méthodes d’ensemble en Python
Instructions
- Préparez la liste de tuples
(string, estimator). Utilisez'dt'comme étiquette pourclf_dt,'lr'pourclf_lr, et'knn'pourclf_knn. - Construisez un classifieur par vote appelé
clf_vote. - Construisez un classifieur par moyenne appelé
clf_avg.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# List of (string, estimator) tuples
estimators = ____
# Build and fit a voting classifier
clf_vote = ____
clf_vote.fit(X_train, y_train)
# Build and fit an averaging classifier
clf_avg = ____
clf_avg.fit(X_train, y_train)
# Evaluate the performance of both models
acc_vote = accuracy_score(y_test, clf_vote.predict(X_test))
acc_avg = accuracy_score(y_test, clf_avg.predict(X_test))
print('Voting: {:.2f}, Averaging: {:.2f}'.format(acc_vote, acc_avg))