Prediksi kelangsungan hidup burung pipit
Pada latihan ini, Anda akan memprediksi probabilitas kelangsungan hidup menggunakan model kelangsungan hidup burung pipit dari latihan sebelumnya.
Ingat bahwa saat memanggil predict() (docs) untuk mendapatkan probabilitas prediksi dari model glm(), Anda harus menyatakan bahwa Anda menginginkan respons:
predict(model, type = "response")
Jika tidak, predict() pada model regresi logistik akan mengembalikan log-odds kejadian yang diprediksi, bukan probabilitasnya.
Anda juga akan menggunakan fungsi GainCurvePlot() (docs) untuk memplot kurva gain dari prediksi model. Jika kurva gain model mendekati kurva gain ideal ("wizard"), maka model mengurutkan burung pipit dengan baik: yaitu, model memprediksi bahwa burung pipit yang benar-benar bertahan hidup akan memiliki probabilitas kelangsungan hidup yang lebih tinggi. Masukan untuk fungsi GainCurvePlot() adalah:
frame: data frame dengan kolom prediksi dan kolom kebenaran dasarxvar: nama kolom prediksi (sebagai string)truthVar: nama kolom dengan keluaran aktual (sebagai string)title: judul untuk plot (sebagai string)
GainCurvePlot(frame, xvar, truthVar, title)
Data frame sparrow dan model sparrow_model telah dimuat sebelumnya.
Latihan ini adalah bagian dari kursus
Supervised Learning di R: Regresi
Petunjuk latihan
- Buat kolom baru di
sparrowbernamapredyang berisi prediksi pada data pelatihan. - Panggil
GainCurvePlot()untuk membuat kurva gain dari prediksi. Apakah model tersebut mampu mengurutkan burung pipit dengan baik berdasarkan apakah mereka benar-benar bertahan hidup atau tidak?
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# sparrow is available
summary(sparrow)
# sparrow_model is available
summary(sparrow_model)
# Make predictions
sparrow$pred <- ___
# Look at gain curve
___(___, ___, ___, "sparrow survival model")