MulaiMulai sekarang secara gratis

Membangun model regresi logistik sederhana

Himpunan data donors berisi 93.462 contoh orang yang dikirimi surat permohonan penggalangan dana untuk veteran militer yang mengalami kelumpuhan. Kolom donated bernilai 1 jika orang tersebut memberikan donasi sebagai respons terhadap surat tersebut dan 0 jika tidak. Hasil biner ini akan menjadi variabel dependen untuk model regresi logistik.

Kolom-kolom lainnya merupakan fitur dari calon donatur yang mungkin memengaruhi perilaku donasi mereka. Ini adalah variabel independen dalam model.

Saat membangun model regresi, sering kali membantu untuk membentuk hipotesis tentang variabel independen mana yang akan memprediksi variabel dependen. Kolom bad_address, yang diatur ke 1 untuk alamat surat yang tidak valid dan 0 jika tidak, tampaknya dapat menurunkan peluang terjadinya donasi. Demikian pula, Anda mungkin menduga bahwa minat keagamaan (interest_religion) dan minat pada urusan veteran (interest_veterans) akan berkaitan dengan peningkatan pemberian amal.

Dalam latihan ini, Anda akan menggunakan tiga faktor tersebut untuk membuat model sederhana perilaku donasi. Himpunan data donors tersedia untuk Anda gunakan.

Latihan ini adalah bagian dari kursus

Supervised Learning di R: Klasifikasi

Lihat Kursus

Petunjuk latihan

  • Periksa donors menggunakan fungsi str().
  • Hitung jumlah kemunculan setiap level variabel donated menggunakan fungsi table().
  • Sesuaikan model regresi logistik menggunakan antarmuka formula dengan tiga variabel independen yang telah dijelaskan sebelumnya.
    • Panggil glm() dengan formula sebagai argumen pertama dan data frame sebagai argumen data.
    • Simpan hasilnya sebagai donation_model.
  • Rangkum objek model dengan summary().

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Examine the dataset to identify potential independent variables


# Explore the dependent variable


# Build the donation model
donation_model <- glm(___, 
                      data = ___, family = "___")

# Summarize the model results
Edit dan Jalankan Kode