Filtri avanzati con metriche multiple

In precedenza abbiamo usato i dati di un negozio online di regali originali per trovare antecedenti utili a promuovere un conseguente mirato. Poiché l’insieme delle regole potenziali era ampio, abbiamo fatto affidamento sull’algoritmo Apriori e su filtri con più metriche per restringere il campo. In questo esercizio, esamineremo l’intero insieme di regole e ne individueremo una utile, invece di puntare a un antecedente specifico.

Nota che i dati sono stati caricati, preprocessati e trasformati in one-hot, e sono disponibili come onehot. Inoltre, apriori() e association_rules() sono stati importati da mlxtend. In questo esercizio applicherai l’algoritmo Apriori per identificare gli insiemi frequenti. Recupererai poi l’insieme delle regole di associazione a partire dagli itemset e applicherai un filtro con metriche multiple.

Questo esercizio fa parte del corso

Analisi del carrello in Python

Visualizza corso

Istruzioni dell'esercizio

Applica l’algoritmo Apriori agli itemset one-hot encoded con una soglia minima di supporto pari a 0.001.
Estrai le regole di associazione usando una soglia minima di supporto pari a 0.001.
Imposta antecedent_support a 0.002 e consequent_support a 0.01.
Imposta confidence maggiore di 0.60 e lift maggiore di 2.50.

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Apply the Apriori algorithm with a minimum support threshold of 0.001
frequent_itemsets = ____(onehot, min_support = ____, use_colnames = True)

# Recover association rules using a minium support threshold of 0.001
rules = ____(frequent_itemsets, metric = '____', min_threshold = 0.001)

# Apply a 0.002 antecedent support threshold, 0.60 confidence threshold, and 2.50 lift threshold
filtered_rules = rules[(rules['antecedent support'] > ____) &
						(____['consequent support'] > 0.01) &
						(rules['____'] > ____) &
						(____ > 2.50)]

# Print remaining rule
print(filtered_rules[['antecedents','consequents']])

Modifica ed esegui il codice

Questo esercizio fa parte del corso

Analisi del carrello in Python

IntermediárioNível de habilidade

4.9+

Inizia il corso gratuitamente

In questo capitolo imparerai le basi della Market Basket Analysis: regole di associazione, metriche e potatura. Metterai poi in pratica questi concetti per aiutare un piccolo negozio di alimentari a migliorare le promozioni e il posizionamento dei prodotti.

Exercise 1: Che cos’è la market basket analysis?Exercise 2: Le basi della market basket analysis Exercise 3: Cross-selling dei prodotti Exercise 4: Identificare le regole di associazione Exercise 5: Antecedenti e conseguenti multipli Exercise 6: Preparare i dati per la market basket analysis Exercise 7: Generare regole di associazione Exercise 8: La metrica più semplice Exercise 9: One-hot encoding dei dati di transazione Exercise 10: Calcolare la metrica di supporto

Le regole di associazione ci dicono che due o più articoli sono correlati. Le metriche ci permettono di quantificare l'utilità di queste relazioni. In questo capitolo applicherai sei metriche per valutare le regole di associazione: supporto, confidenza, lift, conviction, leverage e la metrica di Zhang. Userai quindi regole di associazione e metriche per aiutare una biblioteca e un venditore di e-book.

Exercise 1: Confidenza e lift Exercise 2: Consigliare libri con il supporto Exercise 3: Raffinare il supporto con la confidence Exercise 4: Ulteriore affinamento con il lift Exercise 5: Leverage e conviction Exercise 6: Lift vs leverage Exercise 7: Calcolare la conviction Exercise 8: Calcolare la conviction con una funzione Exercise 9: Promuovere ebook con conviction Exercise 10: Associazione e dissociazione Exercise 11: Calcolare associazione e dissociazione Exercise 12: Definire la metrica di Zhang Exercise 13: Applicare la metrica di Zhang Exercise 14: Regole avanzate Exercise 15: Filtrare con support e conviction Exercise 16: Usare il filtraggio multi-metrica per la promozione incrociata dei libri

Il problema fondamentale della Market Basket Analysis è capire come tradurre enormi quantità di decisioni dei clienti in un numero ridotto di regole utili. Questo processo in genere inizia con l'applicazione dell'algoritmo Apriori e include ulteriori strategie, come la potatura e l'aggregazione. In questo capitolo imparerai a usare questi metodi e li applicherai in esercizi in cui aiuterai un rivenditore a scegliere il layout di un negozio fisico e a realizzare promozioni incrociate dei prodotti.

Exercise 1: Aggregazione Exercise 2: Eseguire l'aggregazione Exercise 3: Definire una funzione di aggregazione Exercise 4: L'algoritmo Apriori Exercise 5: Potatura e Apriori Exercise 6: Identificare i frequent itemsets con Apriori Exercise 7: Selezionare una soglia di supporto Exercise 8: Potatura base dei risultati di Apriori Exercise 9: Generare regole di associazione Exercise 10: Potatura con lift Exercise 11: Potatura con la confidence Exercise 12: Potatura avanzata dei risultati di Apriori Exercise 13: Aggregazione e filtraggio Exercise 14: Applicare la regola di Zhang Exercise 15: Filtri avanzati con metriche multiple

Esercizio attuale

In questo capitolo finale imparerai come le visualizzazioni guidano il processo di potatura e riassumono i risultati finali, che in genere assumono la forma di insiemi di articoli o regole. Dominerai le tre visualizzazioni più utili — heatmap, scatter plot e grafici a coordinate parallele — e le applicherai per aiutare un servizio di streaming di film.

Exercise 1: Heatmap Exercise 2: Visualizzazione del supporto degli itemset Exercise 3: Heatmap con lift Exercise 4: Interpretare le heatmap Exercise 5: Scatter plot Exercise 6: Potatura con scatter plot Exercise 7: Ottimalità del confine supporto-confidenza Exercise 8: Grafico a coordinate parallele Exercise 9: Usare le coordinate parallele per visualizzare le regole Exercise 10: Raffinare un grafico a coordinate parallele Exercise 11: Congratulazioni!