Potatura con lift
Ancora una volta, fai rapporto alla responsabile del negozio di regali originali. Questa volta le dici di non aver identificato alcuna regola quando hai usato una soglia di support più alta per l'algoritmo Apriori e solo due regole quando hai usato una soglia più bassa. Ti fa i complimenti per l’ottimo lavoro, ma ti chiede di considerare l’uso di un’altra metrica per ridurre le due regole a una.
Ti ricordi che il lift ha un’interpretazione semplice: valori maggiori di 1 indicano che gli articoli co-occorrono più di quanto ci aspetteremmo se fossero distribuiti indipendentemente tra le transazioni. Decidi di usare il lift, perché il messaggio sarà facile da comunicare. Nota che pandas è disponibile come pd e i dati delle transazioni codificati one-hot sono disponibili come onehot. Inoltre, apriori è stato importato da mlxtend.
Questo esercizio fa parte del corso
Analisi del carrello in Python
Istruzioni dell'esercizio
- Importa la funzione
association_rulesdamlxtend. - Calcola gli insiemi di item frequenti usando un supporto di 0.001 e una lunghezza massima dell’insieme di 2.
- Completa l’istruzione per mantenere le regole con un lift di almeno 1.0.
- Stampa il DataFrame delle regole.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Import the association rules function
from mlxtend.____ import ____
# Compute frequent itemsets using the Apriori algorithm
frequent_itemsets = apriori(onehot, min_support = ____,
max_len = ____, use_colnames = True)
# Compute all association rules for frequent_itemsets
rules = association_rules(frequent_itemsets,
metric = "____",
min_threshold = ____)
# Print association rules
print(____)