Pelanggaran linimasa
Untuk mengilustrasikan pentingnya linimasa, pertimbangkan contoh ketika Anda melanggar linimasa dan menggunakan informasi dari periode target untuk membangun variabel prediktif.
Ada dua kolom dalam pandas dataframe basetable: "amount_2017" adalah total donasi pada tahun 2017, dan "target" bernilai 1 jika jumlah ini lebih besar dari 30 dan 0 jika tidak.
Bangun model regresi logistik yang menggunakan "amount_2017" sebagai satu-satunya variabel prediktif untuk memprediksi target, lalu hitung AUC-nya.
Latihan ini adalah bagian dari kursus
Predictive Analytics Tingkat Menengah dengan Python
Petunjuk latihan
- Buat dataframe
Xyang berisi variabel prediktif dan dataframeyyang berisi target. - Latih model regresi logistik sehingga
ydiprediksi dariX. Bangun model regresi logistik yang menggunakanamount_2017sebagai satu-satunya variabel prediktif dan memprediksitarget. - Buat prediksi untuk objek dalam
X. - Hitung dan cetak AUC model ini menggunakan fungsi
roc_auc_score.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Select the relevant predictors and the target
X = basetable[["____"]]
y = basetable[["____"]]
# Build the logistic regression model
logreg = linear_model.LogisticRegression()
logreg.____(____, ____)
# Make predictions for X
predictions = logreg.____(____)[:,1]
# Calculate and print the AUC value
auc = ____(____, ____)
print(round(auc, 2))