BaşlayınÜcretsiz Başlayın

Verilere göz atma

salesData veri kümesi çalışma alanına yüklendi. Bu veri kümesi, birinci aydan üçüncü aya kadar müşterilere ait bilgileri içeriyor. Yalnızca dördüncü ayın satışları dahil edilmiştir. Aşağıdaki tablo, anlamı çok açık olmayan bazı değişkenlerin açıklamasını verir.

Variable Description
id müşterinin kimlik numarası
mostFreqStore en çok alışveriş yapılan mağaza
mostFreqCat en çok satın alınan kategori
nCats farklı kategorilerin sayısı
preferredBrand en çok satın alınan marka
nBrands farklı markaların sayısı

readr, dplyr, corrplot ve ggplot2 paketleri kurulup yüklendi.

Bu egzersiz

R ile Pazarlama Analitiği için Machine Learning

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • Veriye genel bir bakış için str() komutunu kullan.
  • Şimdi, son üç ayın sürekli açıklayıcı değişkenleri ile bu ayın satış değişkeni arasındaki korelasyonu görselleştir. cor() ve corrplot() fonksiyonlarını ve boru operatörünü kullan. Doğru değişkenlerin senin için zaten seçilmiş olduğunu unutma.
  • Ayrıca, kategorik değişken preferredBrand seviyelerine bağlı olarak salesThisMon dağılımını gösteren bir kutu grafiği (boxplot) oluştur. Aynısı, kategorik bağımlı değişken mostFreqStore için zaten yapıldı.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Structure of dataset
str(___, give.attr = FALSE)

# Visualization of correlations
salesData %>% select_if(is.numeric) %>%
  select(-id) %>%
  ___
  ___

# Frequent stores
ggplot(salesData) +
    geom_boxplot(aes(x = mostFreqStore, y = salesThisMon))

# Preferred brand
ggplot(___) +
    geom_boxplot(aes(x = ___, y = ___))
Kodu Düzenle ve Çalıştır