Mengidentifikasi itemset yang sering muncul dengan Apriori
Latihan agregasi yang Anda lakukan untuk peritel online terbukti membantu. Latihan tersebut memberi titik awal untuk memahami kategori item mana yang sering muncul dalam transaksi. Kini, peritel ingin menelusuri item individual untuk mengetahui mana yang sering muncul.
Dalam latihan ini, Anda akan menerapkan algoritma Apriori pada himpunan data ritel online tanpa melakukan agregasi terlebih dahulu. Tujuan Anda adalah memangkas itemset menggunakan nilai minimum support dan ambang batas jumlah item maksimum. Perhatikan bahwa pandas telah diimpor sebagai pd dan data yang telah di-one-hot encode tersedia sebagai onehot.
Latihan ini adalah bagian dari kursus
Analisis Market Basket dengan Python
Petunjuk latihan
- Oper
onehotke algoritma Apriori. - Tetapkan nilai support minimum menjadi 0,006.
- Tetapkan panjang maksimum itemset menjadi 3.
- Cetak pratinjau lima itemset pertama.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Import apriori from mlxtend
from mlxtend.frequent_patterns import apriori
# Compute frequent itemsets using the Apriori algorithm
frequent_itemsets = apriori(____,
____ = ____,
max_len = ____,
use_colnames = True)
# Print a preview of the frequent itemsets
print(____.head())