Membangun model regresi logistik sederhana
Himpunan data donors berisi 93.462 contoh orang yang dikirimi surat permohonan penggalangan dana untuk veteran militer yang mengalami kelumpuhan. Kolom donated bernilai 1 jika orang tersebut memberikan donasi sebagai respons terhadap surat tersebut dan 0 jika tidak. Hasil biner ini akan menjadi variabel dependen untuk model regresi logistik.
Kolom-kolom lainnya merupakan fitur dari calon donatur yang mungkin memengaruhi perilaku donasi mereka. Ini adalah variabel independen dalam model.
Saat membangun model regresi, sering kali membantu untuk membentuk hipotesis tentang variabel independen mana yang akan memprediksi variabel dependen. Kolom bad_address, yang diatur ke 1 untuk alamat surat yang tidak valid dan 0 jika tidak, tampaknya dapat menurunkan peluang terjadinya donasi. Demikian pula, Anda mungkin menduga bahwa minat keagamaan (interest_religion) dan minat pada urusan veteran (interest_veterans) akan berkaitan dengan peningkatan pemberian amal.
Dalam latihan ini, Anda akan menggunakan tiga faktor tersebut untuk membuat model sederhana perilaku donasi. Himpunan data donors tersedia untuk Anda gunakan.
Latihan ini adalah bagian dari kursus
Supervised Learning di R: Klasifikasi
Petunjuk latihan
- Periksa
donorsmenggunakan fungsistr(). - Hitung jumlah kemunculan setiap level variabel
donatedmenggunakan fungsitable(). - Sesuaikan model regresi logistik menggunakan antarmuka formula dengan tiga variabel independen yang telah dijelaskan sebelumnya.
- Panggil
glm()dengan formula sebagai argumen pertama dan data frame sebagai argumendata. - Simpan hasilnya sebagai
donation_model.
- Panggil
- Rangkum objek model dengan
summary().
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Examine the dataset to identify potential independent variables
# Explore the dependent variable
# Build the donation model
donation_model <- glm(___,
data = ___, family = "___")
# Summarize the model results