Sesuaikan model probabilitas kelangsungan hidup burung gereja
Dalam latihan ini, Anda akan memperkirakan probabilitas bahwa seekor burung gereja bertahan dari badai musim dingin yang parah, berdasarkan karakteristik fisiknya. Himpunan data sparrow telah dimuat sebelumnya. Luaran yang akan diprediksi adalah status ("Survived", "Perished"). Variabel yang akan kita pertimbangkan adalah:
total_length: panjang burung dari ujung paruh hingga ujung ekor (mm)weight: dalam gramhumerus: panjang humerus ("tulang lengan atas" yang menghubungkan sayap ke tubuh) (inci)
Ingat bahwa saat menggunakan glm() (docs) untuk membuat model regresi logistik, Anda harus secara eksplisit menentukan family = binomial:
glm(formula, data = data, family = binomial)
Anda akan memanggil summary() dan broom::glance() untuk melihat fungsi yang berbeda
untuk menelaah model regresi logistik. Salah satu diagnostik yang akan Anda lihat adalah analog dari \(R^2\), yang disebut pseudo-\(R^2\).
$$ pseudoR^2 = 1 - \frac{deviance}{null.deviance} $$
Anda dapat menganggap deviance sebagai analog dari varians: ini adalah ukuran variasi pada data kategorikal. Pseudo-\(R^2\) analog dengan \(R^2\) pada regresi standar: \(R^2\) adalah ukuran "varians yang dijelaskan" oleh sebuah model regresi. Pseudo-\(R^2\) adalah ukuran "deviance yang dijelaskan".
Latihan ini adalah bagian dari kursus
Supervised Learning di R: Regresi
Petunjuk latihan
- Seperti yang disarankan dalam video, Anda akan memprediksi pada luaran
TRUEdanFALSE. Buat kolom barusurviveddalam data framesparrowyang bernilai TRUE ketikastatus == "Survived". - Buat formula
fmlayang menyatakansurvivedsebagai fungsi dari variabel yang diminati. Cetak formula tersebut. - Sesuaikan model regresi logistik untuk memprediksi probabilitas kelangsungan hidup burung gereja. Simpan model ke variabel
sparrow_model. - Panggil
summary()untuk melihat koefisien model, deviance, dan null deviance. - Panggil
glance()pada model untuk melihat deviance dan diagnostik lainnya dalam sebuah data frame. Simpan keluaran dariglance()ke variabelperf. - Hitung pseudo-\(R^2\).
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# sparrow is available
summary(sparrow)
# Create the survived column
sparrow$survived <- ___
# Create the formula
(fmla <- _____)
# Fit the logistic regression model
sparrow_model <- ___
# Call summary
___
# Call glance
(perf <- ___)
# Calculate pseudo-R-squared
(pseudoR2 <- ___)