MulaiMulai sekarang secara gratis

Memilih model terbaik

Pada latihan ini, Anda akan membandingkan berbagai classifier dan memilih yang kinerjanya terbaik.

Himpunan data di sini—yang sudah dimuat serta dibagi menjadi train dan test set—berisi Pokémon: statistik, tipe, dan status apakah mereka legendary atau tidak. Tujuan classifier kita adalah memprediksi variabel 'Legendary' ini.

Tiga classifier individual telah dilatih pada training set:

  • clf_lr adalah logistic regression.
  • clf_dt adalah decision tree.
  • clf_knn adalah classifier 5-nearest neighbors.

Karena kelasnya tidak seimbang—hanya 65 dari 800 Pokémon dalam himpunan data yang merupakan legendary—kita akan menggunakan F1-Score untuk mengevaluasi kinerja. Fungsi f1_score() dari scikit-learn telah diimpor untuk Anda.

Latihan ini adalah bagian dari kursus

Metode Ensemble di Python

Lihat Kursus

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Predict the labels of the test set
pred_lr = ____
pred_dt = ____
pred_knn = ____
Edit dan Jalankan Kode