Escolhendo o melhor modelo
Neste exercício, você vai comparar diferentes classificadores e escolher aquele que tem o melhor desempenho.
O conjunto de dados aqui — já carregado e dividido em conjuntos de treino e teste — contém informações sobre Pokémon: seus atributos, tipos e se são lendários ou não. O objetivo dos nossos classificadores é prever a variável 'Legendary'.
Três classificadores individuais foram ajustados ao conjunto de treino:
clf_lré uma regressão logística.clf_dté uma árvore de decisão.clf_knné um classificador de 5 vizinhos mais próximos.
Como as classes aqui são desbalanceadas — apenas 65 dos 800 Pokémon no conjunto de dados são lendários — usaremos o F1-score para avaliar o desempenho. A função f1_score() do scikit-learn já foi importada para você.
Este exercício faz parte do curso
Métodos de Ensemble em Python
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Predict the labels of the test set
pred_lr = ____
pred_dt = ____
pred_knn = ____