BaşlayınÜcretsiz başlayın

Verilere göz atma

salesData veri kümesi çalışma alanına yüklendi. Bu veri kümesi, birinci aydan üçüncü aya kadar müşterilere ait bilgileri içeriyor. Yalnızca dördüncü ayın satışları dahil edilmiştir. Aşağıdaki tablo, anlamı çok açık olmayan bazı değişkenlerin açıklamasını verir.

Variable Description
id müşterinin kimlik numarası
mostFreqStore en çok alışveriş yapılan mağaza
mostFreqCat en çok satın alınan kategori
nCats farklı kategorilerin sayısı
preferredBrand en çok satın alınan marka
nBrands farklı markaların sayısı

readr, dplyr, corrplot ve ggplot2 paketleri kurulup yüklendi.

Bu egzersiz, kursun bir parçasıdır

R ile Pazarlama Analitiği için Machine Learning

Kursa Göz Atın

Egzersiz talimatları

  • Veriye genel bir bakış için str() komutunu kullan.
  • Şimdi, son üç ayın sürekli açıklayıcı değişkenleri ile bu ayın satış değişkeni arasındaki korelasyonu görselleştir. cor() ve corrplot() fonksiyonlarını ve boru operatörünü kullan. Doğru değişkenlerin senin için zaten seçilmiş olduğunu unutma.
  • Ayrıca, kategorik değişken preferredBrand seviyelerine bağlı olarak salesThisMon dağılımını gösteren bir kutu grafiği (boxplot) oluştur. Aynısı, kategorik bağımlı değişken mostFreqStore için zaten yapıldı.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Structure of dataset
str(___, give.attr = FALSE)

# Visualization of correlations
salesData %>% select_if(is.numeric) %>%
  select(-id) %>%
  ___
  ___

# Frequent stores
ggplot(salesData) +
    geom_boxplot(aes(x = mostFreqStore, y = salesThisMon))

# Preferred brand
ggplot(___) +
    geom_boxplot(aes(x = ___, y = ___))
Kodu Düzenle ve Çalıştır