ComeçarComece de graça

Escolhendo o melhor modelo

Neste exercício, você vai comparar diferentes classificadores e escolher aquele que tem o melhor desempenho.

O conjunto de dados aqui — já carregado e dividido em conjuntos de treino e teste — contém informações sobre Pokémon: seus atributos, tipos e se são lendários ou não. O objetivo dos nossos classificadores é prever a variável 'Legendary'.

Três classificadores individuais foram ajustados ao conjunto de treino:

  • clf_lr é uma regressão logística.
  • clf_dt é uma árvore de decisão.
  • clf_knn é um classificador de 5 vizinhos mais próximos.

Como as classes aqui são desbalanceadas — apenas 65 dos 800 Pokémon no conjunto de dados são lendários — usaremos o F1-score para avaliar o desempenho. A função f1_score() do scikit-learn já foi importada para você.

Este exercício faz parte do curso

Métodos de Ensemble em Python

Ver curso

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Predict the labels of the test set
pred_lr = ____
pred_dt = ____
pred_knn = ____
Editar e executar o código