1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Phân tích giỏ hàng trong Python

Connected

Bài tập

Pruning bằng confidence

Lại một lần nữa, bạn vẫn chưa chốt được: bạn tìm thấy nhiều luật hữu ích nhưng không rút gọn được xuống còn một. Thậm chí tệ hơn, hai luật bạn tìm thấy dùng cùng một tập mục (itemset) nhưng hoán đổi phần tiền đề (antecedent) và hệ quả (consequent) cho nhau. Bạn quyết định thử xem việc cắt tỉa (pruning) theo một thang đo khác có giúp thu hẹp xuống còn một luật kết hợp hay không.

Vậy thang đo phù hợp là gì? Cả lift và support đều giống nhau cho mọi luật có thể sinh ra từ một itemset, nên bạn quyết định dùng confidence, vốn khác nhau giữa các luật được tạo từ cùng một itemset. Lưu ý pandas đã có sẵn với bí danh pd và dữ liệu giao dịch one-hot đã có trong biến onehot. Ngoài ra, apriori đã được import từ mlxtend.

Hướng dẫn

100 XP
  • Import association_rules từ mlxtend.
  • Hoàn thành câu lệnh chạy thuật toán apriori với giá trị support là 0.0015 và độ dài itemset tối đa là 2.
  • Hoàn thành câu lệnh tạo association rules dùng confidence làm metric và ngưỡng (threshold) là 0.5.