Identificare i frequent itemsets con Apriori
L’esercizio di aggregazione che hai svolto per il rivenditore online è stato utile. Ha fornito un punto di partenza per capire quali categorie di articoli compaiono spesso nelle transazioni. Ora il rivenditore vuole esplorare i singoli articoli per scoprire quali sono frequenti.
In questo esercizio applicherai l’algoritmo Apriori al dataset dell’online retail senza aggregare prima. Il tuo obiettivo sarà potare gli insiemi di item usando un valore minimo di supporto e una soglia massima sul numero di item. Nota che pandas è stato importato come pd e i dati one-hot encoded sono disponibili come onehot.
Questo esercizio fa parte del corso
Analisi del carrello in Python
Istruzioni dell'esercizio
- Passa
onehotall’algoritmo Apriori. - Imposta il valore minimo di supporto a 0,006.
- Imposta la lunghezza massima degli itemset a 3.
- Stampa un’anteprima dei primi cinque itemset.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Import apriori from mlxtend
from mlxtend.frequent_patterns import apriori
# Compute frequent itemsets using the Apriori algorithm
frequent_itemsets = apriori(____,
____ = ____,
max_len = ____,
use_colnames = True)
# Print a preview of the frequent itemsets
print(____.head())