LoslegenKostenlos loslegen

Dummy-Variablen verstehen

Craft Beer zu verkaufen ist hart umkämpft. Mehr Sichtbarkeit im Laden führt in der Regel zu zusätzlichen Verkäufen. Daher setzt die Brauerei auf Point-of-Sale-Displays. Die Absatzmengen von Hoppiness wurden für alle Wochen mit und ohne Displays erfasst.

Es ist sinnvoll, zunächst log(SALES) getrennt für DISPLAY- und Nicht-DISPLAY-Aktivitäten zu betrachten. Das kannst du mit der Funktion aggregate() tun. Die Funktion aggregate() kann auch mit Formelausdrücken umgehen – ein Feature, das ihre Nutzung sehr praktisch macht. Hier gruppiert log(SALES) ~ DISPLAY die Werte von log(SALES) entsprechend den Ausprägungen in DISPLAY. Mit dem Argument FUN wird auf jede Stufe eine angegebene Funktion angewendet. Wieder berechnest du einige einfache deskriptive Kennzahlen mit den Funktionen mean(), min() und max().

Diese Übung ist Teil des Kurses

Response-Modelle in R erstellen

Kurs anzeigen

Anleitung zur Übung

  • Berechne den Mittelwert von log(SALES) für jede Ausprägung in DISPLAY.
  • Berechne das Minimum von log(SALES) für jede Ausprägung in DISPLAY.
  • Berechne das Maximum von log(SALES) für jede Ausprägung in DISPLAY.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Mean log(SALES)
aggregate(___ ~ ___, FUN = ___, data = sales.data)

# Minimum log(SALES)
aggregate(___, FUN = ___, data = sales.data)

# Maximum log(SALES)
___(___, FUN = ___, data = sales.data)
Code bearbeiten und ausführen