Likelihood & log-likelihood
Regresi linear berusaha mengoptimalkan metrik "jumlah kuadrat" untuk menemukan kecocokan terbaik. Metrik itu tidak dapat diterapkan pada regresi logistik. Sebagai gantinya, regresi logistik berusaha mengoptimalkan metrik yang disebut likelihood, atau metrik terkait yang disebut log-likelihood.
Dasbor menampilkan status churn terhadap waktu sejak pembelian terakhir dari himpunan data churn. Garis biru putus-putus adalah garis prediksi regresi logistik yang dihitung oleh geom_smooth() dari ggplot2. (Itulah garis "kecocokan terbaik".) Garis hitam utuh menunjukkan garis prediksi yang dihitung dari koefisien intersep dan kemiringan yang Anda tentukan sebagai plogis(intercept + slope * time_since_last_purchase).
Ubah koefisien intersep dan kemiringan, lalu amati bagaimana nilai likelihood dan log-likelihood berubah.
Saat Anda semakin mendekati garis kecocokan terbaik, pernyataan apa yang benar tentang likelihood dan log-likelihood?
Latihan ini adalah bagian dari kursus
Regresi Tingkat Menengah di R
Latihan interaktif praktis
Ubah teori menjadi tindakan dengan salah satu latihan interaktif kami.
Mulai berolahraga