1. Nauka
  2. /
  3. Kursy
  4. /
  5. Metody zespołowe w Pythonie

Connected

ćwiczenie

Wybór najlepszego modelu

W tym ćwiczeniu porównasz różne klasyfikatory i wybierzesz ten, który działa najlepiej.

Zbiór danych – już wczytany i podzielony na zbiory treningowy i testowy – zawiera dane o Pokémonach: ich statystyki, typy oraz informację o tym, czy dany Pokémon jest legendarny. Zadaniem klasyfikatorów jest przewidywanie wartości zmiennej 'Legendary'.

Trzy klasyfikatory zostały już dopasowane do zbioru treningowego:

  • clf_lr to regresja logistyczna.
  • clf_dt to drzewo decyzyjne.
  • clf_knn to klasyfikator 5 najbliższych sąsiadów.

Ponieważ klasy są tutaj niezrównoważone – spośród 800 Pokémonów w zbiorze danych tylko 65 jest legendarnych – do oceny jakości modeli użyjemy miary F1. Funkcja f1_score() z biblioteki scikit-learn została już zaimportowana.

Instrukcje 1/3

undefined XP
    1
    2
    3
  • Przewidź etykiety dla X_test przy użyciu każdego z klasyfikatorów: clf_lr, clf_dt i clf_knn.