Sahte değişkenleri (dummy variables) anlama
El işi biralarının satışı oldukça rekabetçi. Mağaza içi görünürlüğün artırılması genelde ek satış getirir. Bu nedenle, bira üreticisi satış noktası ekran reklamlarını kullanıyor. Hoppiness'in hacim satışları, ekranların olduğu ve olmadığı tüm haftalar için kaydedildi.
DISPLAY olan ve olmayan haftalar için log(SALES) değerlerini ayrı ayrı inceleyerek başlamak faydalıdır. Bunu aggregate() fonksiyonunu kullanarak yapabilirsin. aggregate() fonksiyonu, formül ifadeleri üzerinde de çalışabilir; bu özellik kullanımını oldukça pratik kılar. Burada log(SALES) ~ DISPLAY, log(SALES) değerlerini DISPLAY içindeki düzeylere göre gruplar. FUN argümanı, her düzeye belirtilen bir fonksiyonu uygular. Yine, mean(), min() ve max() fonksiyonlarını kullanarak bazı basit betimsel ölçüler hesaplayacaksın.
Bu egzersiz, kursun bir parçasıdır
R ile Tepki Modelleri Oluşturma
Egzersiz talimatları
DISPLAYiçindeki her düzey içinlog(SALES)değerlerinin ortalamasını hesapla.DISPLAYiçindeki her düzey içinlog(SALES)değerlerinin en küçüğünü hesapla.DISPLAYiçindeki her düzey içinlog(SALES)değerlerinin en büyüğünü hesapla.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Mean log(SALES)
aggregate(___ ~ ___, FUN = ___, data = sales.data)
# Minimum log(SALES)
aggregate(___, FUN = ___, data = sales.data)
# Maximum log(SALES)
___(___, FUN = ___, data = sales.data)