MulaiMulai sekarang secara gratis

Prediksi kelangsungan hidup burung pipit

Pada latihan ini, Anda akan memprediksi probabilitas kelangsungan hidup menggunakan model kelangsungan hidup burung pipit dari latihan sebelumnya.

Ingat bahwa saat memanggil predict() (docs) untuk mendapatkan probabilitas prediksi dari model glm(), Anda harus menyatakan bahwa Anda menginginkan respons:

predict(model, type = "response")

Jika tidak, predict() pada model regresi logistik akan mengembalikan log-odds kejadian yang diprediksi, bukan probabilitasnya.

Anda juga akan menggunakan fungsi GainCurvePlot() (docs) untuk memplot kurva gain dari prediksi model. Jika kurva gain model mendekati kurva gain ideal ("wizard"), maka model mengurutkan burung pipit dengan baik: yaitu, model memprediksi bahwa burung pipit yang benar-benar bertahan hidup akan memiliki probabilitas kelangsungan hidup yang lebih tinggi. Masukan untuk fungsi GainCurvePlot() adalah:

  • frame: data frame dengan kolom prediksi dan kolom kebenaran dasar
  • xvar: nama kolom prediksi (sebagai string)
  • truthVar: nama kolom dengan keluaran aktual (sebagai string)
  • title: judul untuk plot (sebagai string)

GainCurvePlot(frame, xvar, truthVar, title)

Data frame sparrow dan model sparrow_model telah dimuat sebelumnya.

Latihan ini adalah bagian dari kursus

Supervised Learning di R: Regresi

Lihat Kursus

Petunjuk latihan

  • Buat kolom baru di sparrow bernama pred yang berisi prediksi pada data pelatihan.
  • Panggil GainCurvePlot() untuk membuat kurva gain dari prediksi. Apakah model tersebut mampu mengurutkan burung pipit dengan baik berdasarkan apakah mereka benar-benar bertahan hidup atau tidak?

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# sparrow is available
summary(sparrow)

# sparrow_model is available
summary(sparrow_model)

# Make predictions
sparrow$pred <- ___

# Look at gain curve
___(___, ___, ___, "sparrow survival model")
Edit dan Jalankan Kode