Meerdere mandjes
Als je in de praktijk market basket analysis uitvoert, krijg je waarschijnlijk te maken met honderden, zo niet duizenden, mandjes en itemcombinaties. De gegevensset Online_Retail_clean, die in je werkruimte beschikbaar is, is de opgeschoonde versie zonder missende waarden van de gegevensset Online_Retail_2011_Q1. Je gebruikt deze gegevensset om met een groot aantal mandjes aan de slag te gaan en het gemiddelde aantal zowel totale als unieke items per mandje te bepalen. Je visualiseert ook de verdelingen van het aantal items in de verschillende mandjes.
Deze oefening maakt deel uit van de cursus
Market Basket-analyse in R
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create dataset with basket counts and inspect results
basket_size = Online_Retail_clean %>%
group_by(___) %>%
___(n_total = ___,
n_items = n_distinct(___))
___(___)