Dummy-Variablen verstehen
Craft Beer zu verkaufen ist hart umkämpft. Mehr Sichtbarkeit im Laden führt in der Regel zu zusätzlichen Verkäufen. Daher setzt die Brauerei auf Point-of-Sale-Displays. Die Absatzmengen von Hoppiness wurden für alle Wochen mit und ohne Displays erfasst.
Es ist sinnvoll, zunächst log(SALES) getrennt für DISPLAY- und Nicht-DISPLAY-Aktivitäten zu betrachten. Das kannst du mit der Funktion aggregate() tun. Die Funktion aggregate() kann auch mit Formelausdrücken umgehen – ein Feature, das ihre Nutzung sehr praktisch macht. Hier gruppiert log(SALES) ~ DISPLAY die Werte von log(SALES) entsprechend den Ausprägungen in DISPLAY. Mit dem Argument FUN wird auf jede Stufe eine angegebene Funktion angewendet. Wieder berechnest du einige einfache deskriptive Kennzahlen mit den Funktionen mean(), min() und max().
Diese Übung ist Teil des Kurses
<Kurs>Response-Modelle in R erstellen</Kurs>Übungsanweisungen
- Berechne den Mittelwert von
log(SALES)für jede Ausprägung inDISPLAY. - Berechne das Minimum von
log(SALES)für jede Ausprägung inDISPLAY. - Berechne das Maximum von
log(SALES)für jede Ausprägung inDISPLAY.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Mean log(SALES)
aggregate(___ ~ ___, FUN = ___, data = sales.data)
# Minimum log(SALES)
aggregate(___, FUN = ___, data = sales.data)
# Maximum log(SALES)
___(___, FUN = ___, data = sales.data)