1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Phân tích giỏ hàng trong Python

Connected

Bài tập

Chọn ngưỡng support

Quản lý của cửa hàng quà tặng trực tuyến xem kết quả bạn cung cấp từ bài trước và khen bạn làm tốt. Tuy vậy, cô ấy nêu một vấn đề: tất cả các itemset bạn tìm được chỉ chứa một mặt hàng. Cô ấy hỏi liệu có thể dùng một quy tắc bớt khắt khe hơn để tạo ra nhiều itemset hơn, bao gồm cả những itemset có nhiều mặt hàng.

Sau khi đồng ý, bạn suy nghĩ về nguyên nhân thiếu các itemset có nhiều hơn 1 mặt hàng. Không thể là do tham số max_len, vì tham số đó đã đặt là ba. Bạn kết luận nguyên nhân là do support và quyết định thử hai giá trị khác nhau, mỗi lần kiểm tra xem có bao nhiêu itemset bổ sung được tạo ra. Lưu ý pandas đã có sẵn với tên pd và dữ liệu one-hot encoded đã có với tên onehot.

Hướng dẫn 1/2

undefined XP
    1
    2
  • Hoàn thiện câu lệnh import cho thuật toán apriori.
  • Với frequent_itemsets_1, đặt min support là 0.003 và độ dài tối đa là 3.
  • Với frequent_itemsets_2, đặt min support là 0.001 và độ dài tối đa là 3.