Menggunakan himpunan variabel yang berbeda
Menambahkan lebih banyak variabel dan dengan demikian lebih banyak kompleksitas ke model regresi logistik Anda tidak serta-merta menghasilkan model yang lebih akurat. Dalam latihan ini Anda dapat memverifikasi apakah menambahkan 3 variabel ke sebuah model menghasilkan model yang lebih akurat.
variables_1 dan variables_2 tersedia di lingkungan Anda: Anda dapat mencetaknya ke konsol untuk melihat seperti apa bentuknya.
Latihan ini adalah bagian dari kursus
Pengantar Predictive Analytics dengan Python
Petunjuk latihan
- Latih model
logregmenggunakanvariables_2yang memuat 3 variabel tambahan dibandingkanvariables_1. - Buat prediksi untuk model ini.
- Hitung AUC dari model ini.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create appropriate DataFrames
X_1 = basetable[variables_1]
X_2 = basetable[variables_2]
y = basetable[["target"]]
# Create the logistic regression model
logreg = linear_model.LogisticRegression()
# Make predictions using the first set of variables and assign the AUC to auc_1
logreg.fit(X_1, y)
predictions_1 = logreg.predict_proba(X_1)[:,1]
auc_1 = roc_auc_score(y, predictions_1)
# Make predictions using the second set of variables and assign the AUC to auc_2
logreg.____(____, ____)
predictions_2 = ____.____(____)[____,____]
auc_2 = ____(____, ____)
# Print auc_1 and auc_2
print(round(auc_1,2))
print(round(auc_2,2))