Birden çok açıklayıcı değişkeni görselleştirme
Lojistik regresyon birden çok açıklayıcı değişkeni de destekler. Çizim tarafındaki zorluklar, doğrusal regresyon vakasındakiyle benzerdir: grafiğe daha fazla sayısal değişken eklemek hızla zorlaşır. Burada iki sayısal açıklayıcı değişken durumuna bakacağız ve çözüm temelde öncekiyle aynıdır: yanıtı belirtmek için rengi kullan.
Burada yanıtın yalnızca iki olası değeri vardır (sıfır ve bir) ve daha sonra tahmin edilen yanıtları eklediğimizde, değerlerin tümü sıfır ile bir arasındadır. Tahmin edilen yanıtları dahil ettiğinde, grafikten belirlemen gereken en önemli şey, tahminlerin sıfıra mı yoksa bire mi yakın olduğudur. Bu da 0.5'te bölünen iki renkli bir gradyanın çok işe yaradığı anlamına gelir: 0.5'in üzerindeki yanıtlar bir renkte, 0.5'in altındakiler başka bir renkte gösterilir.
Banka churn veri kümesi churn olarak mevcut; ggplot2 yüklü.
Bu egzersiz
R'de Orta Düzey Regresyon
kursunun bir parçasıdırEgzersiz talimatları
churnveri kümesini kullanarak, satın alma yakınlığınıtime_since_last_purchaseile, müşteri ilişkisinin süresinetime_since_first_purchasekarşı çiz ve müşterinin churn edip etmediğine göre (has_churned) renklendir.- Bir nokta katmanı ekle ve saydamlığı
0.5olarak ayarla. - Orta noktası
0.5olan iki renkli bir gradyan kullan. - Siyah-beyaz temayı kullan.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Using churn, plot recency vs. length of relationship colored by churn status
___ +
# Make it a scatter plot, with transparency 0.5
___ +
# Use a 2-color gradient split at 0.5
___ +
# Use the black and white theme
___