Sağkalım analizi için veriler
Aşağıdaki egzersizlerde, sağkalım analizini pratik etmek için bir online mağazanın müşterilerine ait verilerle çalışacaksın. Ancak bu kez konu terk etme süresi değil, ikinci siparişe kadar geçen süre.
Veriler dataNextOrder nesnesinde saklanıyor. boughtAgain değişkeni, yalnızca bir sipariş veren müşteriler için 0, halihazırda ikinci bir sipariş vermiş müşteriler için 1 değerini alır. Bir kişi ikinci kez sipariş verdiyse, daysSinceFirstPurch değişkeninde ilk ve ikinci sipariş arasındaki gün sayısını görürsün. İkinci siparişi olmayan müşteriler için daysSinceFirstPurch, ilk (ve en son) siparişlerinden bu yana geçen süreyi içerir.
ggplot2 paketi çalışma alanına zaten yüklendi.
Bu egzersiz, kursun bir parçasıdır
R ile Pazarlama Analitiği için Machine Learning
Egzersiz talimatları
head()kullanarak verilere göz at.- İlk satın alımdan bu yana geçen günlerin histogramını, ikinci siparişi olan ve olmayan müşteriler için ayrı ayrı görselleştir. (
ggplot2koduna alışık değilsen endişelenme: Sadece x değişkeni olarakdaysSinceFirstPurchve dolgu ile facet değişkeni olarakboughtAgainkullanman yeterli.)
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Look at the head of the data
___(dataNextOrder)
# Plot a histogram
ggplot(dataNextOrder) +
geom_histogram(aes(x = ___,
fill = factor(___))) +
facet_grid( ~ boughtAgain) + # Separate plots for boughtAgain = 1 vs. 0
theme(legend.position = "none") # Don't show legend