Aan de slagGa gratis aan de slag

Dummyvariabelen begrijpen

Ambachtelijk bier verkopen is zeer competitief. Meer zichtbaarheid in de winkel leidt meestal tot extra verkoop. Daarom maakt de brouwerij gebruik van point-of-sale-displays. De verkoopaantallen van Hoppiness zijn voor alle weken met en zonder displays geregistreerd.

Het is handig om te beginnen met het apart bekijken van log(SALES) voor DISPLAY- en geen-DISPLAY-activiteiten. Dat kan met de functie aggregate(). De functie aggregate() kan ook met formule-uitdrukkingen overweg, wat het gebruik erg praktisch maakt. Hier groepeert log(SALES) ~ DISPLAY log(SALES) volgens de niveaus in DISPLAY. Het argument FUN past een opgegeven functie toe op elk niveau. Je berekent opnieuw enkele eenvoudige beschrijvende maten met de functies mean(), min() en max().

Deze oefening maakt deel uit van de cursus

Responsmodellen bouwen in R

Cursus bekijken

Oefeninstructies

  • Bereken het gemiddelde van log(SALES) voor elk niveau in DISPLAY.
  • Bereken het minimum van log(SALES) voor elk niveau in DISPLAY.
  • Bereken het maximum van log(SALES) voor elk niveau in DISPLAY.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Mean log(SALES)
aggregate(___ ~ ___, FUN = ___, data = sales.data)

# Minimum log(SALES)
aggregate(___, FUN = ___, data = sales.data)

# Maximum log(SALES)
___(___, FUN = ___, data = sales.data)
Code bewerken en uitvoeren