Tính tối ưu của biên hỗ trợ–độ tin cậy

Bạn quay lại gặp nhà sáng lập với biểu đồ phân tán tạo ra ở bài tập trước và hỏi liệu cô ấy có muốn bạn dùng phương pháp cắt tỉa (pruning) để khôi phục biên hỗ trợ–độ tin cậy hay không. Bạn kể về kết quả Bayardo–Agrawal, nhưng cô ấy tỏ ra hoài nghi và hỏi liệu bạn có thể minh họa bằng một ví dụ.

Nhớ rằng biểu đồ phân tán có thể thay đổi kích thước điểm chấm theo một thước đo thứ ba, bạn quyết định dùng cách đó để chứng minh tính tối ưu của biên hỗ trợ–độ tin cậy. Bạn sẽ cho thấy điều này bằng cách tỉ lệ kích thước điểm chấm theo thước đo lift, một trong các thước đo mà Bayardo–Agrawal đã áp dụng. Dữ liệu one-hot đã được nhập sẵn cho bạn và có sẵn dưới tên onehot. Ngoài ra, apriori() và association_rules() đã được nhập, và pandas có sẵn với tên pd.

Áp dụng thuật toán Apriori lên DataFrame onehot.
Tính các luật kết hợp với thước đo support và ngưỡng tối thiểu 0.0.
Hoàn thiện biểu thức vẽ biểu đồ phân tán sao cho kích thước điểm chấm được tỉ lệ theo lift.

Bài tập

Tính tối ưu của biên hỗ trợ–độ tin cậy

Hướng dẫn

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}Bài tập

Hướng dẫn

Bài tập