Wybór najlepszego modelu

W tym ćwiczeniu porównasz różne klasyfikatory i wybierzesz ten, który działa najlepiej.

Zbiór danych – już wczytany i podzielony na zbiory treningowy i testowy – zawiera dane o Pokémonach: ich statystyki, typy oraz informację o tym, czy dany Pokémon jest legendarny. Zadaniem klasyfikatorów jest przewidywanie wartości zmiennej 'Legendary'.

Trzy klasyfikatory zostały już dopasowane do zbioru treningowego:

clf_lr to regresja logistyczna.
clf_dt to drzewo decyzyjne.
clf_knn to klasyfikator 5 najbliższych sąsiadów.

Ponieważ klasy są tutaj niezrównoważone – spośród 800 Pokémonów w zbiorze danych tylko 65 jest legendarnych – do oceny jakości modeli użyjemy miary F1. Funkcja f1_score() z biblioteki scikit-learn została już zaimportowana.

Przewidź etykiety dla X_test przy użyciu każdego z klasyfikatorów: clf_lr, clf_dt i clf_knn.

ćwiczenie

Wybór najlepszego modelu

Instrukcje 1/3

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}ćwiczenie

Instrukcje 1/3

ćwiczenie