Sahte değişkenleri (dummy variables) anlama
El işi biralarının satışı oldukça rekabetçi. Mağaza içi görünürlüğün artırılması genelde ek satış getirir. Bu nedenle, bira üreticisi satış noktası ekran reklamlarını kullanıyor. Hoppiness'in hacim satışları, ekranların olduğu ve olmadığı tüm haftalar için kaydedildi.
DISPLAY olan ve olmayan haftalar için log(SALES) değerlerini ayrı ayrı inceleyerek başlamak faydalıdır. Bunu aggregate() fonksiyonunu kullanarak yapabilirsin. aggregate() fonksiyonu, formül ifadeleri üzerinde de çalışabilir; bu özellik kullanımını oldukça pratik kılar. Burada log(SALES) ~ DISPLAY, log(SALES) değerlerini DISPLAY içindeki düzeylere göre gruplar. FUN argümanı, her düzeye belirtilen bir fonksiyonu uygular. Yine, mean(), min() ve max() fonksiyonlarını kullanarak bazı basit betimsel ölçüler hesaplayacaksın.
Bu egzersiz
R ile Tepki Modelleri Oluşturma
kursunun bir parçasıdırEgzersiz talimatları
DISPLAYiçindeki her düzey içinlog(SALES)değerlerinin ortalamasını hesapla.DISPLAYiçindeki her düzey içinlog(SALES)değerlerinin en küçüğünü hesapla.DISPLAYiçindeki her düzey içinlog(SALES)değerlerinin en büyüğünü hesapla.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Mean log(SALES)
aggregate(___ ~ ___, FUN = ___, data = sales.data)
# Minimum log(SALES)
aggregate(___, FUN = ___, data = sales.data)
# Maximum log(SALES)
___(___, FUN = ___, data = sales.data)