Dummyvariabelen begrijpen
Ambachtelijk bier verkopen is zeer competitief. Meer zichtbaarheid in de winkel leidt meestal tot extra verkoop. Daarom maakt de brouwerij gebruik van point-of-sale-displays. De verkoopaantallen van Hoppiness zijn voor alle weken met en zonder displays geregistreerd.
Het is handig om te beginnen met het apart bekijken van log(SALES) voor DISPLAY- en geen-DISPLAY-activiteiten. Dat kan met de functie aggregate(). De functie aggregate() kan ook met formule-uitdrukkingen overweg, wat het gebruik erg praktisch maakt. Hier groepeert log(SALES) ~ DISPLAY log(SALES) volgens de niveaus in DISPLAY. Het argument FUN past een opgegeven functie toe op elk niveau. Je berekent opnieuw enkele eenvoudige beschrijvende maten met de functies mean(), min() en max().
Deze oefening maakt deel uit van de cursus
Responsmodellen bouwen in R
Oefeninstructies
- Bereken het gemiddelde van
log(SALES)voor elk niveau inDISPLAY. - Bereken het minimum van
log(SALES)voor elk niveau inDISPLAY. - Bereken het maximum van
log(SALES)voor elk niveau inDISPLAY.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Mean log(SALES)
aggregate(___ ~ ___, FUN = ___, data = sales.data)
# Minimum log(SALES)
aggregate(___, FUN = ___, data = sales.data)
# Maximum log(SALES)
___(___, FUN = ___, data = sales.data)