Aan de slagBegin gratis

Dummyvariabelen begrijpen

Ambachtelijk bier verkopen is zeer competitief. Meer zichtbaarheid in de winkel leidt meestal tot extra verkoop. Daarom maakt de brouwerij gebruik van point-of-sale-displays. De verkoopaantallen van Hoppiness zijn voor alle weken met en zonder displays geregistreerd.

Het is handig om te beginnen met het apart bekijken van log(SALES) voor DISPLAY- en geen-DISPLAY-activiteiten. Dat kan met de functie aggregate(). De functie aggregate() kan ook met formule-uitdrukkingen overweg, wat het gebruik erg praktisch maakt. Hier groepeert log(SALES) ~ DISPLAY log(SALES) volgens de niveaus in DISPLAY. Het argument FUN past een opgegeven functie toe op elk niveau. Je berekent opnieuw enkele eenvoudige beschrijvende maten met de functies mean(), min() en max().

Deze oefening maakt deel uit van de cursus

Responsmodellen bouwen in R

Bekijk cursus

Oefeninstructies

  • Bereken het gemiddelde van log(SALES) voor elk niveau in DISPLAY.
  • Bereken het minimum van log(SALES) voor elk niveau in DISPLAY.
  • Bereken het maximum van log(SALES) voor elk niveau in DISPLAY.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Mean log(SALES)
aggregate(___ ~ ___, FUN = ___, data = sales.data)

# Minimum log(SALES)
aggregate(___, FUN = ___, data = sales.data)

# Maximum log(SALES)
___(___, FUN = ___, data = sales.data)
Code bewerken en uitvoeren