1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Ensemble Methods in Python

Connected

cvičení

Výběr nejlepšího modelu

V tomto cvičení porovnáš různé klasifikátory a vybereš ten nejvýkonnější.

Dataset – již načtený a rozdělený na trénovací a testovací sadu – obsahuje data o Pokémonech: jejich statistiky, typy a informaci o tom, zda jsou legendární. Cílem klasifikátorů je předpovědět hodnotu proměnné 'Legendary'.

Na trénovací sadě byly natrénované tři samostatné klasifikátory:

  • clf_lr je logistická regrese.
  • clf_dt je rozhodovací strom.
  • clf_knn je klasifikátor 5 nejbližších sousedů.

Protože jsou třídy nevyvážené – z 800 Pokémonů v datasetu je legendárních pouze 65 – použijeme k hodnocení výkonu F1-skóre. Funkce f1_score() ze scikit-learn je již naimportovaná.

Pokyny 1/3

undefined XP
    1
    2
    3
  • Předpověz štítky pro X_test pomocí každého z klasifikátorů – clf_lr, clf_dt a clf_knn.