1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Xây dựng Recommendation Engine bằng Python

Connected

Bài tập

Mất mát thông tin trong phân rã

Bạn có thể thắc mắc làm sao các nhân tố (factors) với ít cột hơn nhiều lại có thể tóm tắt một DataFrame lớn hơn mà không bị mất mát. Thực tế là không thể — các nhân tố chúng ta tạo thường chỉ là một xấp xỉ gần đúng của dữ liệu, vì việc mất đi một phần thông tin là khó tránh. Điều này có nghĩa là các giá trị dự đoán có thể không chính xác tuyệt đối, nhưng sẽ đủ gần để hữu ích.

Trong bài tập này, bạn sẽ kiểm tra lại cùng DataFrame gốc trước khi phân rã từ bài trước được nạp dưới tên original_df, và so sánh nó với tích của hai nhân tố của nó, user_matrix và item_matrix.

Hướng dẫn

100 XP
  • Tính tích vô hướng (dot product) của user_matrix và item_matrix và lưu vào predictions_df.