Kecocokan in-sample untuk model terbatas

Anda telah menghitung akurasi untuk logitModelFull. Sangat penting untuk melakukan hal tersebut pada semua kandidat model.

Karena itu, logitModelNew sudah ditentukan dan tersedia di environment Anda.

Saat membandingkan nilai dari berbagai model satu sama lain: jika beberapa model memiliki nilai akurasi yang sama, selalu pilih model dengan variabel penjelas yang lebih sedikit.

Latihan ini merupakan bagian dari kursus

Machine Learning untuk Analitik Pemasaran dengan R

Lihat Kursus

Instruksi latihan

Lakukan langkah yang sama seperti pada latihan sebelumnya untuk model baru.
Gunakan predict() untuk memperoleh probabilitas setiap pelanggan akan gagal bayar.
Lalu hitung matriks kebingungan dengan ambang klasifikasi 0,5 yang sama. Perhatikan bahwa SDMTools tidak lagi dapat diunduh dari CRAN. Instal sebagai gantinya melalui remotes::install_version("SDMTools", "1.1-221.2").
Hitung akurasi model terbatas dan bandingkan dengan akurasi model penuh. Anda akan melanjutkan analisis hanya dengan model yang lebih unggul.

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Calculate the accuracy for 'logitModelNew'
# Make prediction
defaultData$predNew <- predict(logitModelNew, type = ___, na.action = ___)

# Construct the in-sample confusion matrix
confMatrixModelNew <- confusion.matrix(defaultData$___,defaultData$___, threshold = ___)
confMatrixModelNew

# Calculate the accuracy...
accuracyNew <- sum(diag(___)) / ___(___)
accuracyNew

# and compare it to the full model's accuracy
accuracyFull

Edit dan Jalankan Kode