Memilih variabel terbaik berikutnya
Metode pemilihan variabel forward stepwise dimulai dengan himpunan variabel kosong dan berjalan bertahap, di mana pada setiap tahap variabel terbaik berikutnya ditambahkan. Untuk mengimplementasikan prosedur ini, dua fungsi praktis telah disiapkan untuk Anda.
Fungsi auc menghitung AUC untuk suatu himpunan variabel variables pada model yang menggunakan himpunan variabel tersebut sebagai prediktor. Fungsi next_best menghitung variabel mana yang sebaiknya ditambahkan pada langkah berikutnya ke dalam daftar variabel.
Pada latihan ini, Anda akan bereksperimen dengan fungsi-fungsi tersebut untuk lebih memahami tujuannya. Anda akan menghitung AUC dari suatu himpunan variabel, menghitung variabel mana yang sebaiknya ditambahkan berikutnya, dan memverifikasi bahwa hal ini memang menghasilkan AUC yang optimal.
Latihan ini adalah bagian dari kursus
Pengantar Predictive Analytics dengan Python
Petunjuk latihan
- Fungsi
auctelah disiapkan untuk Anda. Hitung AUC dari model yang menggunakan"max_gift","mean_gift", dan"min_gift"sebagai prediktor. Anda harus mengoper variabel-variabel ini dalam sebuah list sebagai argumen pertama untuk fungsiauc. - Fungsi
next_besttelah disiapkan untuk Anda. Hitung variabel mana yang sebaiknya ditambahkan berikutnya, dengan asumsi"max_gift","mean_gift", dan"min_gift"saat ini ada di dalam model, dan"age"serta"gender_F"adalah kandidat prediktor berikutnya. Argumen pertama fungsinext_bestadalah list berisi variabel saat ini, sedangkan argumen kedua adalah list berisi kandidat prediktor. - Hitung AUC dari model yang menggunakan
"max_gift","mean_gift","min_gift", dan"age"sebagai prediktor. - Hitung AUC dari model yang menggunakan
"max_gift","mean_gift","min_gift", dan"gender_F"sebagai prediktor.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Calculate the AUC of a model that uses "max_gift", "mean_gift" and "min_gift" as predictors
auc_current = ____([____, ____, ____], ["target"], basetable)
print(round(auc_current,4))
# Calculate which variable among "age" and "gender_F" should be added to the variables "max_gift", "mean_gift" and "min_gift"
next_variable = ____([____, ____, ____], [____, ____], ["target"], basetable)
print(next_variable)
# Calculate the AUC of a model that uses "max_gift", "mean_gift", "min_gift" and "age" as predictors
auc_current_age = ____([____, ____, ____, ____], ["target"], basetable)
print(round(auc_current_age,4))
# Calculate the AUC of a model that uses "max_gift", "mean_gift", "min_gift" and "gender_F" as predictors
auc_current_gender_F = ____([____], ["target"], basetable)
print(round(auc_current_gender_F,4))