IniziaInizia gratis

Potatura con scatter plot

Dopo aver visto la tua proposta per il servizio di streaming basato su Batman dell'esercizio precedente, la fondatrice si rende conto che il suo piano iniziale potrebbe essere stato troppo ristretto. Invece di concentrarsi sui titoli iniziali, ti chiede di puntare a schemi generali nelle regole di associazione e poi effettuare la potatura di conseguenza. Il tuo obiettivo dovrebbe essere individuare un ampio insieme di associazioni forti.

Per fortuna, hai appena imparato a generare scatter plot. Decidi di iniziare tracciando support e confidence, dato che molte regole ottimali secondo metriche comuni si trovano sul bordo confidence-support. I dati one-hot encoded sono già stati importati per te e sono disponibili come onehot. Inoltre, apriori() e association_rules() sono stati importati e pandas è disponibile come pd.

Questo esercizio fa parte del corso

Analisi del carrello in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Genera un gran numero di insiemi di item con 2 elementi impostando il supporto minimo a 0.0075 e la lunghezza massima a 2.
  • Completa l'istruzione per association_rules() in modo da evitare ulteriore filtraggio.
  • Completa l'istruzione per generare lo scatter plot, impostando la variabile y su confidence.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Import seaborn under its standard alias
import seaborn as sns

# Apply the Apriori algorithm with a support value of 0.0075
frequent_itemsets = apriori(onehot, min_support = ___, 
                            use_colnames = True, max_len = ____)

# Generate association rules without performing additional pruning
rules = association_rules(____, metric = 'support', 
                          min_threshold = ____)

# Generate scatterplot using support and confidence
sns.scatterplot(x = "support", y = "____", data = ____)
plt.show()
Modifica ed esegui il codice