Mengevaluasi model pada data test dan train
Fungsi auc_train_test menghitung AUC dari model yang dibangun pada himpunan train dan dievaluasi pada himpunan test:
auc_train, auc_test = auc_train_test(variables, target, train, test)
Dengan variables berupa daftar nama variabel yang digunakan dalam model.
Pada latihan ini, Anda akan menerapkan fungsi tersebut, dan memeriksa apakah AUC train dan test serupa.
Latihan ini adalah bagian dari kursus
Pengantar Predictive Analytics dengan Python
Petunjuk latihan
basetablesudah dimuat. Bagi basetable sehingga himpunan train berisi 70% data, dan pastikan himpunan train dan test memiliki insidensi target yang sama.- Hitung AUC train dan test dari model dengan menggunakan
"age"dan"gender_F"sebagai prediktor dengan fungsiauc_train_test.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Load the partitioning module
from sklearn.model_selection import train_test_split
# Create DataFrames with variables and target
X = basetable.drop('target', 1)
y = basetable["target"]
# Carry out 70-30 partititioning with stratification
X_train, X_test, y_train, y_test = ____(X, y, test_size = ____, stratify = ____)
# Create the final train and test basetables
train = pd.concat([X_train, y_train], axis=1)
test = pd.concat([X_test, y_test], axis=1)
# Apply the auc_train_test function
auc_train, auc_test = ____([____, ____], ["target"], ____, ____)
print(round(auc_train,2))
print(round(auc_test,2))