Filtri avanzati con metriche multiple
In precedenza abbiamo usato i dati di un negozio online di regali originali per trovare antecedenti utili a promuovere un conseguente mirato. Poiché l’insieme delle regole potenziali era ampio, abbiamo fatto affidamento sull’algoritmo Apriori e su filtri con più metriche per restringere il campo. In questo esercizio, esamineremo l’intero insieme di regole e ne individueremo una utile, invece di puntare a un antecedente specifico.
Nota che i dati sono stati caricati, preprocessati e trasformati in one-hot, e sono disponibili come onehot. Inoltre, apriori() e association_rules() sono stati importati da mlxtend. In questo esercizio applicherai l’algoritmo Apriori per identificare gli insiemi frequenti. Recupererai poi l’insieme delle regole di associazione a partire dagli itemset e applicherai un filtro con metriche multiple.
Questo esercizio fa parte del corso
Analisi del carrello in Python
Istruzioni dell'esercizio
- Applica l’algoritmo Apriori agli itemset one-hot encoded con una soglia minima di supporto pari a 0.001.
- Estrai le regole di associazione usando una soglia minima di supporto pari a 0.001.
- Imposta
antecedent_supporta 0.002 econsequent_supporta 0.01. - Imposta
confidencemaggiore di 0.60 eliftmaggiore di 2.50.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Apply the Apriori algorithm with a minimum support threshold of 0.001
frequent_itemsets = ____(onehot, min_support = ____, use_colnames = True)
# Recover association rules using a minium support threshold of 0.001
rules = ____(frequent_itemsets, metric = '____', min_threshold = 0.001)
# Apply a 0.002 antecedent support threshold, 0.60 confidence threshold, and 2.50 lift threshold
filtered_rules = rules[(rules['antecedent support'] > ____) &
(____['consequent support'] > 0.01) &
(rules['____'] > ____) &
(____ > 2.50)]
# Print remaining rule
print(filtered_rules[['antecedents','consequents']])