MulaiMulai sekarang secara gratis

Optimalitas batas support-confidence

Anda kembali kepada pendiri dengan scatterplot yang dihasilkan pada latihan sebelumnya dan menanyakan apakah ia ingin Anda menggunakan pruning untuk memperoleh kembali batas support-confidence. Anda menceritakan tentang hasil Bayardo-Agrawal, tetapi ia tampak skeptis dan meminta apakah Anda dapat mendemonstrasikannya dengan sebuah contoh.

Mengingat bahwa scatterplot dapat menskalakan ukuran titik berdasarkan metrik ketiga, Anda memutuskan menggunakannya untuk menunjukkan optimalitas batas support-confidence. Anda akan menunjukkan ini dengan menskalakan ukuran titik menggunakan metrik lift, yang merupakan salah satu metrik yang dibahas oleh Bayardo-Agrawal. Data one-hot encoded telah diimpor untuk Anda dan tersedia sebagai onehot. Selain itu, apriori() dan association_rules() telah diimpor dan pandas tersedia sebagai pd.

Latihan ini adalah bagian dari kursus

Analisis Market Basket dengan Python

Lihat Kursus

Petunjuk latihan

  • Terapkan algoritma Apriori pada DataFrame onehot.
  • Hitung aturan asosiasi menggunakan metrik support dan ambang minimum 0.0.
  • Lengkapi ekspresi untuk scatterplot sehingga ukuran titik diskalakan oleh lift.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Import seaborn under its standard alias
import seaborn as sns

# Apply the Apriori algorithm with a support value of 0.0075
frequent_itemsets = ____(____, min_support = 0.0075, 
                         use_colnames = True, max_len = 2)

# Generate association rules without performing additional pruning
rules = ____(frequent_itemsets, metric = "support", 
                          min_threshold = ____)

# Generate scatterplot using support and confidence
sns.scatterplot(x = "support", y = "confidence", 
                size = "____", data = rules)
plt.show()
Edit dan Jalankan Kode