Dummy-Variablen verstehen
Craft Beer zu verkaufen ist hart umkämpft. Mehr Sichtbarkeit im Laden führt in der Regel zu zusätzlichen Verkäufen. Daher setzt die Brauerei auf Point-of-Sale-Displays. Die Absatzmengen von Hoppiness wurden für alle Wochen mit und ohne Displays erfasst.
Es ist sinnvoll, zunächst log(SALES) getrennt für DISPLAY- und Nicht-DISPLAY-Aktivitäten zu betrachten. Das kannst du mit der Funktion aggregate() tun. Die Funktion aggregate() kann auch mit Formelausdrücken umgehen – ein Feature, das ihre Nutzung sehr praktisch macht. Hier gruppiert log(SALES) ~ DISPLAY die Werte von log(SALES) entsprechend den Ausprägungen in DISPLAY. Mit dem Argument FUN wird auf jede Stufe eine angegebene Funktion angewendet. Wieder berechnest du einige einfache deskriptive Kennzahlen mit den Funktionen mean(), min() und max().
Diese Übung ist Teil des Kurses
Response-Modelle in R erstellen
Anleitung zur Übung
- Berechne den Mittelwert von
log(SALES)für jede Ausprägung inDISPLAY. - Berechne das Minimum von
log(SALES)für jede Ausprägung inDISPLAY. - Berechne das Maximum von
log(SALES)für jede Ausprägung inDISPLAY.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Mean log(SALES)
aggregate(___ ~ ___, FUN = ___, data = sales.data)
# Minimum log(SALES)
aggregate(___, FUN = ___, data = sales.data)
# Maximum log(SALES)
___(___, FUN = ___, data = sales.data)