Selezionare una soglia di supporto
La manager del negozio online di articoli regalo guarda i risultati che hai fornito nell'esercizio precedente e ti fa i complimenti per l'ottimo lavoro. Solleva però un punto: tutti gli insiemi di articoli che hai identificato contengono un solo articolo. Ti chiede se sarebbe possibile usare una regola meno restrittiva e generare più insiemi, magari includendo quelli con più articoli.
Dopo aver concordato di procedere così, rifletti su cosa possa spiegare l’assenza di insiemi con più di 1 articolo. Non può essere il parametro max_len, perché era impostato a tre. Decidi che dev’essere il supporto e scegli di testare due valori diversi, controllando ogni volta quanti insiemi aggiuntivi vengono generati. Nota che pandas è disponibile come pd e i dati one-hot encoded sono disponibili come onehot.
Questo esercizio fa parte del corso
Analisi del carrello in Python
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Import apriori from mlxtend
from mlxtend.____ import ____
# Compute frequent itemsets using a support of 0.003 and length of 3
frequent_itemsets_1 = apriori(onehot, min_support = ____,
max_len = ____, use_colnames = True)
# Compute frequent itemsets using a support of 0.001 and length of 3
frequent_itemsets_2 = apriori(onehot, min_support = ____,
____, use_colnames = True)
# Print the number of freqeuent itemsets
print(len(frequent_itemsets_1), len(frequent_itemsets_2))