MulaiMulai sekarang secara gratis

Sesuaikan model probabilitas kelangsungan hidup burung gereja

Dalam latihan ini, Anda akan memperkirakan probabilitas bahwa seekor burung gereja bertahan dari badai musim dingin yang parah, berdasarkan karakteristik fisiknya. Himpunan data sparrow telah dimuat sebelumnya. Luaran yang akan diprediksi adalah status ("Survived", "Perished"). Variabel yang akan kita pertimbangkan adalah:

  • total_length: panjang burung dari ujung paruh hingga ujung ekor (mm)
  • weight: dalam gram
  • humerus : panjang humerus ("tulang lengan atas" yang menghubungkan sayap ke tubuh) (inci)

Ingat bahwa saat menggunakan glm() (docs) untuk membuat model regresi logistik, Anda harus secara eksplisit menentukan family = binomial:

glm(formula, data = data, family = binomial)

Anda akan memanggil summary() dan broom::glance() untuk melihat fungsi yang berbeda untuk menelaah model regresi logistik. Salah satu diagnostik yang akan Anda lihat adalah analog dari \(R^2\), yang disebut pseudo-\(R^2\).

$$ pseudoR^2 = 1 - \frac{deviance}{null.deviance} $$

Anda dapat menganggap deviance sebagai analog dari varians: ini adalah ukuran variasi pada data kategorikal. Pseudo-\(R^2\) analog dengan \(R^2\) pada regresi standar: \(R^2\) adalah ukuran "varians yang dijelaskan" oleh sebuah model regresi. Pseudo-\(R^2\) adalah ukuran "deviance yang dijelaskan".

Latihan ini adalah bagian dari kursus

Supervised Learning di R: Regresi

Lihat Kursus

Petunjuk latihan

  • Seperti yang disarankan dalam video, Anda akan memprediksi pada luaran TRUE dan FALSE. Buat kolom baru survived dalam data frame sparrow yang bernilai TRUE ketika status == "Survived".
  • Buat formula fmla yang menyatakan survived sebagai fungsi dari variabel yang diminati. Cetak formula tersebut.
  • Sesuaikan model regresi logistik untuk memprediksi probabilitas kelangsungan hidup burung gereja. Simpan model ke variabel sparrow_model.
  • Panggil summary() untuk melihat koefisien model, deviance, dan null deviance.
  • Panggil glance() pada model untuk melihat deviance dan diagnostik lainnya dalam sebuah data frame. Simpan keluaran dari glance() ke variabel perf.
  • Hitung pseudo-\(R^2\).

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# sparrow is available
summary(sparrow)

# Create the survived column
sparrow$survived <- ___

# Create the formula
(fmla <- _____)

# Fit the logistic regression model
sparrow_model <- ___

# Call summary
___

# Call glance
(perf <- ___)

# Calculate pseudo-R-squared
(pseudoR2 <- ___)
Edit dan Jalankan Kode