Lojistik regresyon algoritması
Haydi işin mutfağına inelim ve bir lojistik regresyon algoritması yazalım. R'ın glm() fonksiyonu oldukça karmaşık olduğu için, tek bir veri kümesi için basit lojistik regresyonu uygulamakla yetineceksin.
Metrik olarak kareler toplamı yerine olasılığı (likelihood) kullanmak istiyoruz. Ancak, log-olasılık (log-likelihood) hesaplama açısından daha kararlı olduğundan onu kullanacağız. Aslında bir değişiklik daha var: log-olasılığı maksimize etmek isteriz ama optim() varsayılan olarak minimumu arar; bu yüzden hesaplamayı negatif log-olasılık üzerinden yapmak daha kolaydır.
Her gözlem için log-olasılık değeri şöyledir

Hesaplanacak metrik, bu log-olasılık katkılarının toplamının eksi işaretlisidir.
Açıklayıcı değerler (churn veri çerçevesindeki time_since_last_purchase sütunu) x_actual olarak mevcut.
Tepki değerleri (churn veri çerçevesindeki has_churned sütunu) y_actual olarak mevcut.
Bu egzersiz
R'de Orta Düzey Regresyon
kursunun bir parçasıdırUygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Set the intercept to 1
intercept <- ___
# Set the slope to 0.5
slope <- ___
# Calculate the predicted y values
y_pred <- ___
# Calculate the log-likelihood for each term
log_likelihoods <- ___
# Calculate minus the sum of the log-likelihoods for each term
___