Pemangkasan dengan scatterplot
Setelah meninjau proposal layanan streaming bertema Batman dari latihan sebelumnya, pendirinya menyadari bahwa rencana awalnya mungkin terlalu sempit. Alih-alih berfokus pada judul awal, ia meminta Anda untuk menitikberatkan pada pola umum dalam aturan asosiatif dan kemudian melakukan pemangkasan sesuai kebutuhan. Tujuan Anda adalah mengidentifikasi sejumlah besar asosiasi yang kuat.
Untungnya, Anda baru saja mempelajari cara membuat scatterplot. Anda memutuskan untuk mulai dengan memplot support dan confidence, karena semua aturan yang optimal menurut banyak metrik umum terletak pada batas confidence-support. Data yang telah di-one-hot encoding telah diimpor untuk Anda dan tersedia sebagai onehot. Selain itu, apriori() dan association_rules() telah diimpor dan pandas tersedia sebagai pd.
Latihan ini adalah bagian dari kursus
Analisis Market Basket dengan Python
Petunjuk latihan
- Hasilkan banyak himpunan item dengan 2 item dengan menetapkan minimum support ke 0,0075 dan mengatur panjang maksimum ke 2.
- Lengkapi pernyataan untuk
association_rules()dengan cara yang menghindari penyaringan tambahan. - Lengkapi pernyataan untuk menghasilkan scatterplot, dengan menetapkan variabel
yuntuk menggunakanconfidence.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Import seaborn under its standard alias
import seaborn as sns
# Apply the Apriori algorithm with a support value of 0.0075
frequent_itemsets = apriori(onehot, min_support = ___,
use_colnames = True, max_len = ____)
# Generate association rules without performing additional pruning
rules = association_rules(____, metric = 'support',
min_threshold = ____)
# Generate scatterplot using support and confidence
sns.scatterplot(x = "support", y = "____", data = ____)
plt.show()