Identificare i frequent itemsets con Apriori

L’esercizio di aggregazione che hai svolto per il rivenditore online è stato utile. Ha fornito un punto di partenza per capire quali categorie di articoli compaiono spesso nelle transazioni. Ora il rivenditore vuole esplorare i singoli articoli per scoprire quali sono frequenti.

In questo esercizio applicherai l’algoritmo Apriori al dataset dell’online retail senza aggregare prima. Il tuo obiettivo sarà potare gli insiemi di item usando un valore minimo di supporto e una soglia massima sul numero di item. Nota che pandas è stato importato come pd e i dati one-hot encoded sono disponibili come onehot.

Questo esercizio fa parte del corso

Analisi del carrello in Python

Visualizza corso

Istruzioni dell'esercizio

Passa onehot all’algoritmo Apriori.
Imposta il valore minimo di supporto a 0,006.
Imposta la lunghezza massima degli itemset a 3.
Stampa un’anteprima dei primi cinque itemset.

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Import apriori from mlxtend
from mlxtend.frequent_patterns import apriori

# Compute frequent itemsets using the Apriori algorithm
frequent_itemsets = apriori(____, 
                            ____ = ____, 
                            max_len = ____, 
                            use_colnames = True)

# Print a preview of the frequent itemsets
print(____.head())

Modifica ed esegui il codice

Questo esercizio fa parte del corso

Analisi del carrello in Python

IntermediárioNível de habilidade

4.9+

Inizia il corso gratuitamente

In questo capitolo imparerai le basi della Market Basket Analysis: regole di associazione, metriche e potatura. Metterai poi in pratica questi concetti per aiutare un piccolo negozio di alimentari a migliorare le promozioni e il posizionamento dei prodotti.

Exercise 1: Che cos’è la market basket analysis?Exercise 2: Le basi della market basket analysis Exercise 3: Cross-selling dei prodotti Exercise 4: Identificare le regole di associazione Exercise 5: Antecedenti e conseguenti multipli Exercise 6: Preparare i dati per la market basket analysis Exercise 7: Generare regole di associazione Exercise 8: La metrica più semplice Exercise 9: One-hot encoding dei dati di transazione Exercise 10: Calcolare la metrica di supporto

Le regole di associazione ci dicono che due o più articoli sono correlati. Le metriche ci permettono di quantificare l'utilità di queste relazioni. In questo capitolo applicherai sei metriche per valutare le regole di associazione: supporto, confidenza, lift, conviction, leverage e la metrica di Zhang. Userai quindi regole di associazione e metriche per aiutare una biblioteca e un venditore di e-book.

Exercise 1: Confidenza e lift Exercise 2: Consigliare libri con il supporto Exercise 3: Raffinare il supporto con la confidence Exercise 4: Ulteriore affinamento con il lift Exercise 5: Leverage e conviction Exercise 6: Lift vs leverage Exercise 7: Calcolare la conviction Exercise 8: Calcolare la conviction con una funzione Exercise 9: Promuovere ebook con conviction Exercise 10: Associazione e dissociazione Exercise 11: Calcolare associazione e dissociazione Exercise 12: Definire la metrica di Zhang Exercise 13: Applicare la metrica di Zhang Exercise 14: Regole avanzate Exercise 15: Filtrare con support e conviction Exercise 16: Usare il filtraggio multi-metrica per la promozione incrociata dei libri

Il problema fondamentale della Market Basket Analysis è capire come tradurre enormi quantità di decisioni dei clienti in un numero ridotto di regole utili. Questo processo in genere inizia con l'applicazione dell'algoritmo Apriori e include ulteriori strategie, come la potatura e l'aggregazione. In questo capitolo imparerai a usare questi metodi e li applicherai in esercizi in cui aiuterai un rivenditore a scegliere il layout di un negozio fisico e a realizzare promozioni incrociate dei prodotti.

Exercise 1: Aggregazione Exercise 2: Eseguire l'aggregazione Exercise 3: Definire una funzione di aggregazione Exercise 4: L'algoritmo Apriori Exercise 5: Potatura e Apriori Exercise 6: Identificare i frequent itemsets con Apriori

Esercizio attuale

Exercise 7: Selezionare una soglia di supporto Exercise 8: Potatura base dei risultati di Apriori Exercise 9: Generare regole di associazione Exercise 10: Potatura con lift Exercise 11: Potatura con la confidence Exercise 12: Potatura avanzata dei risultati di Apriori Exercise 13: Aggregazione e filtraggio Exercise 14: Applicare la regola di Zhang Exercise 15: Filtri avanzati con metriche multiple

In questo capitolo finale imparerai come le visualizzazioni guidano il processo di potatura e riassumono i risultati finali, che in genere assumono la forma di insiemi di articoli o regole. Dominerai le tre visualizzazioni più utili — heatmap, scatter plot e grafici a coordinate parallele — e le applicherai per aiutare un servizio di streaming di film.

Exercise 1: Heatmap Exercise 2: Visualizzazione del supporto degli itemset Exercise 3: Heatmap con lift Exercise 4: Interpretare le heatmap Exercise 5: Scatter plot Exercise 6: Potatura con scatter plot Exercise 7: Ottimalità del confine supporto-confidenza Exercise 8: Grafico a coordinate parallele Exercise 9: Usare le coordinate parallele per visualizzare le regole Exercise 10: Raffinare un grafico a coordinate parallele Exercise 11: Congratulazioni!