Verilere göz atma
salesData veri kümesi çalışma alanına yüklendi. Bu veri kümesi, birinci aydan üçüncü aya kadar müşterilere ait bilgileri içeriyor. Yalnızca dördüncü ayın satışları dahil edilmiştir. Aşağıdaki tablo, anlamı çok açık olmayan bazı değişkenlerin açıklamasını verir.
| Variable | Description |
|---|---|
| id | müşterinin kimlik numarası |
| mostFreqStore | en çok alışveriş yapılan mağaza |
| mostFreqCat | en çok satın alınan kategori |
| nCats | farklı kategorilerin sayısı |
| preferredBrand | en çok satın alınan marka |
| nBrands | farklı markaların sayısı |
readr, dplyr, corrplot ve ggplot2 paketleri kurulup yüklendi.
Bu egzersiz
R ile Pazarlama Analitiği için Machine Learning
kursunun bir parçasıdırEgzersiz talimatları
- Veriye genel bir bakış için
str()komutunu kullan. - Şimdi, son üç ayın sürekli açıklayıcı değişkenleri ile bu ayın satış değişkeni arasındaki korelasyonu görselleştir.
cor()vecorrplot()fonksiyonlarını ve boru operatörünü kullan. Doğru değişkenlerin senin için zaten seçilmiş olduğunu unutma. - Ayrıca, kategorik değişken
preferredBrandseviyelerine bağlı olaraksalesThisMondağılımını gösteren bir kutu grafiği (boxplot) oluştur. Aynısı, kategorik bağımlı değişkenmostFreqStoreiçin zaten yapıldı.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Structure of dataset
str(___, give.attr = FALSE)
# Visualization of correlations
salesData %>% select_if(is.numeric) %>%
select(-id) %>%
___
___
# Frequent stores
ggplot(salesData) +
geom_boxplot(aes(x = mostFreqStore, y = salesThisMon))
# Preferred brand
ggplot(___) +
geom_boxplot(aes(x = ___, y = ___))