1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Xây dựng Recommendation Engine bằng Python

Connected

Bài tập

Phân rã ma trận của bạn

Giờ thì bạn đã chuẩn bị dữ liệu bằng cách chuẩn hóa về trung bình và điền các giá trị trống còn lại bằng 0, bạn có thể bắt đầu tìm các thừa số của dữ liệu. Trong bài tập này, bạn sẽ phân tách dữ liệu user_ratings_centered mà bạn đã tạo ở bài trước thành 3 thừa số: U, sigma và Vt.

  • U là một ma trận với mỗi hàng tương ứng một người dùng
  • Vt có mỗi cột tương ứng một bộ phim
  • sigma là một mảng trọng số mà bạn sẽ cần chuyển thành ma trận đường chéo

user_ratings_centered mà bạn đã tạo ở bài trước đã được nạp sẵn cho bạn.

Hướng dẫn 1/2

undefined XP
  • 1
    • Import svds từ scipy.sparse.linalg.
    • Phân rã user_ratings_pivot_centered thành các ma trận thừa số: U, sigma và Vt.
  • 2
    • Chuyển mảng sigma thành một ma trận đường chéo.