1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Phân tích giỏ hàng trong Python

Connected

Bài tập

Lọc nâng cao với nhiều chỉ số

Trước đó, bạn đã dùng dữ liệu từ một cửa hàng quà tặng độc đáo trực tuyến để tìm các tiền đề (antecedents) có thể dùng để quảng bá cho một hậu đề (consequent) mục tiêu. Vì tập luật tiềm năng rất lớn, chúng ta phải dựa vào thuật toán Apriori và bộ lọc đa chỉ số để thu hẹp phạm vi. Trong bài tập này, bạn sẽ xem toàn bộ tập luật và tìm một luật hữu ích, thay vì nhắm mục tiêu một tiền đề cụ thể.

Lưu ý: dữ liệu đã được tải, tiền xử lý, mã hóa one-hot và có sẵn dưới tên onehot. Ngoài ra, apriori() và association_rules() đã được import từ mlxtend. Trong bài tập này, bạn sẽ áp dụng thuật toán Apriori để xác định các tập mục thường xuyên. Sau đó, bạn sẽ trích xuất tập luật kết hợp từ các tập mục và áp dụng lọc theo nhiều chỉ số.

Hướng dẫn

100 XP
  • Áp dụng thuật toán Apriori cho các tập mục đã mã hóa one-hot với ngưỡng support tối thiểu là 0.001.
  • Trích xuất các luật kết hợp với ngưỡng support tối thiểu là 0.001.
  • Đặt antecedent_support ở mức 0.002 và consequent_support ở mức 0.01.
  • Thiết lập confidence lớn hơn 0.60 và lift lớn hơn 2.50.