Memilih model terbaik
Pada latihan ini, Anda akan membandingkan berbagai classifier dan memilih yang kinerjanya terbaik.
Himpunan data di sini—yang sudah dimuat serta dibagi menjadi train dan test set—berisi Pokémon: statistik, tipe, dan status apakah mereka legendary atau tidak. Tujuan classifier kita adalah memprediksi variabel 'Legendary' ini.
Tiga classifier individual telah dilatih pada training set:
clf_lradalah logistic regression.clf_dtadalah decision tree.clf_knnadalah classifier 5-nearest neighbors.
Karena kelasnya tidak seimbang—hanya 65 dari 800 Pokémon dalam himpunan data yang merupakan legendary—kita akan menggunakan F1-Score untuk mengevaluasi kinerja. Fungsi f1_score() dari scikit-learn telah diimpor untuk Anda.
Latihan ini adalah bagian dari kursus
Metode Ensemble di Python
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Predict the labels of the test set
pred_lr = ____
pred_dt = ____
pred_knn = ____