Výběr nejlepšího modelu

V tomto cvičení porovnáš různé klasifikátory a vybereš ten nejvýkonnější.

Dataset – již načtený a rozdělený na trénovací a testovací sadu – obsahuje data o Pokémonech: jejich statistiky, typy a informaci o tom, zda jsou legendární. Cílem klasifikátorů je předpovědět hodnotu proměnné 'Legendary'.

Na trénovací sadě byly natrénované tři samostatné klasifikátory:

clf_lr je logistická regrese.
clf_dt je rozhodovací strom.
clf_knn je klasifikátor 5 nejbližších sousedů.

Protože jsou třídy nevyvážené – z 800 Pokémonů v datasetu je legendárních pouze 65 – použijeme k hodnocení výkonu F1-skóre. Funkce f1_score() ze scikit-learn je již naimportovaná.

Předpověz štítky pro X_test pomocí každého z klasifikátorů – clf_lr, clf_dt a clf_knn.

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}cvičení

Pokyny 1/3

cvičení