Membuat model regresi logistik
Setelah Anda memiliki himpunan data latih dan uji acak, Anda dapat membuat model regresi logistik pada data latih menggunakan fungsi glm(). glm() adalah versi yang lebih canggih dari lm() yang memungkinkan berbagai jenis model regresi, selain regresi ordinary least squares standar.
Pastikan untuk menyertakan argumen family = "binomial" pada glm() untuk menyatakan bahwa Anda ingin melakukan regresi logistik (bukan regresi linear). Contohnya:
glm(Target ~ ., family = "binomial", dataset)
Abaikan peringatan seperti glm.fit: algorithm did not converge atau glm.fit: fitted probabilities numerically 0 or 1 occurred. Peringatan ini umum terjadi pada himpunan data kecil dan biasanya tidak menimbulkan masalah. Ini biasanya berarti himpunan data Anda perfectly separable (terpisah sempurna), yang dapat menimbulkan masalah pada perhitungan matematis di balik model, tetapi fungsi glm() di R hampir selalu cukup andal untuk menangani kasus ini tanpa masalah.
Setelah Anda memiliki model glm() yang terpasang pada himpunan data Anda, Anda dapat memprediksi keluaran (misalnya rock atau mine) pada himpunan test menggunakan fungsi predict() dengan argumen type = "response":
predict(my_model, test, type = "response")
Latihan ini adalah bagian dari kursus
Machine Learning dengan caret di R
Petunjuk latihan
- Buat model regresi logistik bernama
modeluntuk memprediksiClassmenggunakan semua variabel lainnya sebagai prediktor. Gunakan himpunan data latih untukSonar. - Lakukan prediksi pada himpunan
testmenggunakan model tersebut. Simpan hasilnya sebagaipseperti yang sudah Anda lakukan sebelumnya.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Fit glm model: model
# Predict on test: p