Sağkalım analizi için veriler
Aşağıdaki egzersizlerde, sağkalım analizini pratik etmek için bir online mağazanın müşterilerine ait verilerle çalışacaksın. Ancak bu kez konu terk etme süresi değil, ikinci siparişe kadar geçen süre.
Veriler dataNextOrder nesnesinde saklanıyor. boughtAgain değişkeni, yalnızca bir sipariş veren müşteriler için 0, halihazırda ikinci bir sipariş vermiş müşteriler için 1 değerini alır. Bir kişi ikinci kez sipariş verdiyse, daysSinceFirstPurch değişkeninde ilk ve ikinci sipariş arasındaki gün sayısını görürsün. İkinci siparişi olmayan müşteriler için daysSinceFirstPurch, ilk (ve en son) siparişlerinden bu yana geçen süreyi içerir.
ggplot2 paketi çalışma alanına zaten yüklendi.
Bu egzersiz
R ile Pazarlama Analitiği için Machine Learning
kursunun bir parçasıdırEgzersiz talimatları
head()kullanarak verilere göz at.- İlk satın alımdan bu yana geçen günlerin histogramını, ikinci siparişi olan ve olmayan müşteriler için ayrı ayrı görselleştir. (
ggplot2koduna alışık değilsen endişelenme: Sadece x değişkeni olarakdaysSinceFirstPurchve dolgu ile facet değişkeni olarakboughtAgainkullanman yeterli.)
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Look at the head of the data
___(dataNextOrder)
# Plot a histogram
ggplot(dataNextOrder) +
geom_histogram(aes(x = ___,
fill = factor(___))) +
facet_grid( ~ boughtAgain) + # Separate plots for boughtAgain = 1 vs. 0
theme(legend.position = "none") # Don't show legend