1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Phân tích giỏ hàng trong Python

Connected

Bài tập

Cắt tỉa với lift

Bạn lại báo cáo cho quản lý cửa hàng quà tặng độc đáo. Lần này, bạn cho biết không tìm được quy tắc nào khi dùng ngưỡng support cao cho thuật toán Apriori và chỉ có hai quy tắc khi dùng ngưỡng thấp hơn. Cô ấy khen bạn làm tốt, nhưng đề nghị bạn thử dùng một thước đo khác để rút từ hai quy tắc xuống còn một.

Bạn nhớ rằng lift có cách diễn giải đơn giản: giá trị lớn hơn 1 cho thấy các mặt hàng cùng xuất hiện thường xuyên hơn so với kỳ vọng nếu chúng phân bố độc lập giữa các giao dịch. Bạn quyết định dùng lift vì thông điệp này dễ truyền đạt. Lưu ý pandas đã sẵn sàng dưới tên pd và dữ liệu giao dịch one-hot đã có trong onehot. Ngoài ra, apriori đã được import từ mlxtend.

Hướng dẫn

100 XP
  • Import hàm association_rules từ mlxtend.
  • Tính các tập mục thường xuyên với support = 0.001 và độ dài tập mục tối đa là 2.
  • Hoàn thiện câu lệnh để giữ các quy tắc có lift ít nhất 1.0.
  • In DataFrame các quy tắc.