Optimalitas batas support-confidence
Anda kembali kepada pendiri dengan scatterplot yang dihasilkan pada latihan sebelumnya dan menanyakan apakah ia ingin Anda menggunakan pruning untuk memperoleh kembali batas support-confidence. Anda menceritakan tentang hasil Bayardo-Agrawal, tetapi ia tampak skeptis dan meminta apakah Anda dapat mendemonstrasikannya dengan sebuah contoh.
Mengingat bahwa scatterplot dapat menskalakan ukuran titik berdasarkan metrik ketiga, Anda memutuskan menggunakannya untuk menunjukkan optimalitas batas support-confidence. Anda akan menunjukkan ini dengan menskalakan ukuran titik menggunakan metrik lift, yang merupakan salah satu metrik yang dibahas oleh Bayardo-Agrawal. Data one-hot encoded telah diimpor untuk Anda dan tersedia sebagai onehot. Selain itu, apriori() dan association_rules() telah diimpor dan pandas tersedia sebagai pd.
Latihan ini adalah bagian dari kursus
Analisis Market Basket dengan Python
Petunjuk latihan
- Terapkan algoritma Apriori pada DataFrame
onehot. - Hitung aturan asosiasi menggunakan metrik
supportdan ambang minimum 0.0. - Lengkapi ekspresi untuk scatterplot sehingga ukuran titik diskalakan oleh
lift.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Import seaborn under its standard alias
import seaborn as sns
# Apply the Apriori algorithm with a support value of 0.0075
frequent_itemsets = ____(____, min_support = 0.0075,
use_colnames = True, max_len = 2)
# Generate association rules without performing additional pruning
rules = ____(frequent_itemsets, metric = "support",
min_threshold = ____)
# Generate scatterplot using support and confidence
sns.scatterplot(x = "support", y = "confidence",
size = "____", data = rules)
plt.show()