Menentukan urutan variabel
Prosedur pemilihan variabel forward stepwise dimulai dengan himpunan variabel kosong, lalu menambahkan prediktor satu per satu. Pada setiap langkah, dipilih prediktor yang memiliki AUC tertinggi ketika digabungkan dengan variabel saat ini.
Dalam latihan ini, Anda akan mempelajari cara mengimplementasikan prosedur pemilihan variabel forward stepwise. Untuk itu, Anda dapat menggunakan fungsi next_best yang telah disiapkan untuk Anda. Contoh penggunaannya sebagai berikut:
next_best(current_variables,candidate_variables,target,basetable)
di mana current_variables adalah daftar variabel yang sudah ada dalam model dan candidate_variables adalah daftar variabel yang dapat ditambahkan berikutnya.
Latihan ini adalah bagian dari kursus
Pengantar Predictive Analytics dengan Python
Petunjuk latihan
- Gunakan fungsi
next_bestuntuk menghitung variabel terbaik berikutnya dan tetapkan kenext_variable. - Perbarui daftar
current_variables. - Perbarui daftar
candidate_variables.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Find the candidate variables
candidate_variables = list(basetable.columns.values)
candidate_variables.remove("target")
# Initialize the current variables
current_variables = []
# The forward stepwise variable selection procedure
number_iterations = 5
for i in range(0, number_iterations):
next_variable = ____(____, ____, ["target"], basetable)
current_variables = current_variables + [____]
candidate_variables.remove(____)
print("Variable added in step " + str(i+1) + " is " + next_variable + ".")
print(current_variables)