MulaiMulai sekarang secara gratis

Memilih variabel terbaik berikutnya

Metode pemilihan variabel forward stepwise dimulai dengan himpunan variabel kosong dan berjalan bertahap, di mana pada setiap tahap variabel terbaik berikutnya ditambahkan. Untuk mengimplementasikan prosedur ini, dua fungsi praktis telah disiapkan untuk Anda.

Fungsi auc menghitung AUC untuk suatu himpunan variabel variables pada model yang menggunakan himpunan variabel tersebut sebagai prediktor. Fungsi next_best menghitung variabel mana yang sebaiknya ditambahkan pada langkah berikutnya ke dalam daftar variabel.

Pada latihan ini, Anda akan bereksperimen dengan fungsi-fungsi tersebut untuk lebih memahami tujuannya. Anda akan menghitung AUC dari suatu himpunan variabel, menghitung variabel mana yang sebaiknya ditambahkan berikutnya, dan memverifikasi bahwa hal ini memang menghasilkan AUC yang optimal.

Latihan ini adalah bagian dari kursus

Pengantar Predictive Analytics dengan Python

Lihat Kursus

Petunjuk latihan

  • Fungsi auc telah disiapkan untuk Anda. Hitung AUC dari model yang menggunakan "max_gift", "mean_gift", dan "min_gift" sebagai prediktor. Anda harus mengoper variabel-variabel ini dalam sebuah list sebagai argumen pertama untuk fungsi auc.
  • Fungsi next_best telah disiapkan untuk Anda. Hitung variabel mana yang sebaiknya ditambahkan berikutnya, dengan asumsi "max_gift", "mean_gift", dan "min_gift" saat ini ada di dalam model, dan "age" serta "gender_F" adalah kandidat prediktor berikutnya. Argumen pertama fungsi next_best adalah list berisi variabel saat ini, sedangkan argumen kedua adalah list berisi kandidat prediktor.
  • Hitung AUC dari model yang menggunakan "max_gift", "mean_gift", "min_gift", dan "age" sebagai prediktor.
  • Hitung AUC dari model yang menggunakan "max_gift", "mean_gift", "min_gift", dan "gender_F" sebagai prediktor.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Calculate the AUC of a model that uses "max_gift", "mean_gift" and "min_gift" as predictors
auc_current = ____([____, ____, ____], ["target"], basetable)
print(round(auc_current,4))

# Calculate which variable among "age" and "gender_F" should be added to the variables "max_gift", "mean_gift" and "min_gift"
next_variable = ____([____, ____, ____], [____, ____], ["target"], basetable)
print(next_variable)

# Calculate the AUC of a model that uses "max_gift", "mean_gift", "min_gift" and "age" as predictors
auc_current_age = ____([____, ____, ____, ____], ["target"], basetable)
print(round(auc_current_age,4))

# Calculate the AUC of a model that uses "max_gift", "mean_gift", "min_gift" and "gender_F" as predictors
auc_current_gender_F = ____([____], ["target"], basetable)
print(round(auc_current_gender_F,4))
Edit dan Jalankan Kode