Kecocokan in-sample untuk model terbatas
Anda telah menghitung akurasi untuk logitModelFull. Sangat penting untuk melakukan hal tersebut pada semua kandidat model.
Karena itu, logitModelNew sudah ditentukan dan tersedia di environment Anda.
Saat membandingkan nilai dari berbagai model satu sama lain: jika beberapa model memiliki nilai akurasi yang sama, selalu pilih model dengan variabel penjelas yang lebih sedikit.
Latihan ini adalah bagian dari kursus
Machine Learning untuk Analitik Pemasaran dengan R
Petunjuk latihan
Lakukan langkah yang sama seperti pada latihan sebelumnya untuk model baru.
Gunakan
predict()untuk memperoleh probabilitas setiap pelanggan akan gagal bayar.Lalu hitung matriks kebingungan dengan ambang klasifikasi 0,5 yang sama. Perhatikan bahwa
SDMToolstidak lagi dapat diunduh dari CRAN. Instal sebagai gantinya melaluiremotes::install_version("SDMTools", "1.1-221.2").Hitung akurasi model terbatas dan bandingkan dengan akurasi model penuh. Anda akan melanjutkan analisis hanya dengan model yang lebih unggul.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Calculate the accuracy for 'logitModelNew'
# Make prediction
defaultData$predNew <- predict(logitModelNew, type = ___, na.action = ___)
# Construct the in-sample confusion matrix
confMatrixModelNew <- confusion.matrix(defaultData$___,defaultData$___, threshold = ___)
confMatrixModelNew
# Calculate the accuracy...
accuracyNew <- sum(diag(___)) / ___(___)
accuracyNew
# and compare it to the full model's accuracy
accuracyFull