1. Learn
  2. /
  3. Courses
  4. /
  5. Phân tích giỏ hàng trong Python

Connected

Exercise

One-hot encode dữ liệu giao dịch

Xuyên suốt khóa học, chúng ta sẽ dùng một pipeline chung để tiền xử lý dữ liệu phục vụ market basket analysis. Bước đầu tiên là import một pandas DataFrame và chọn cột chứa các giao dịch. Mỗi giao dịch trong cột là một chuỗi gồm nhiều mặt hàng, phân tách bằng dấu phẩy. Bước tiếp theo là dùng một hàm lambda để tách mỗi chuỗi giao dịch thành một danh sách, qua đó biến đổi cột thành một danh sách các danh sách.

Trong bài tập này, bạn sẽ bắt đầu với danh sách các danh sách từ bộ dữ liệu cửa hàng tạp hóa, có sẵn dưới tên transactions. Sau đó, bạn sẽ biến đổi transactions thành một DataFrame one-hot encoded, nơi mỗi cột gồm các giá trị TRUE và FALSE cho biết một mặt hàng có được bao gồm trong giao dịch hay không.

Instructions

100 XP
  • Từ mlxtend.preprocessing, import TransactionEncoder
  • Khởi tạo một transaction encoder và xác định các mặt hàng duy nhất trong transactions.
  • One-hot encode transactions thành một mảng và gán giá trị của nó cho onehot.
  • Chuyển mảng thành một pandas DataFrame, sử dụng tên mặt hàng làm tiêu đề cột.