1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Luyện tập câu hỏi phỏng vấn Machine Learning bằng Python

Connected

Bài tập

Phân rã giá trị kỳ dị (SVD)

Trong bài tập trước, bạn đã thấy PCA hữu ích thế nào trong việc giảm số chiều của một tập dữ liệu khi gặp câu hỏi về dữ liệu có chiều cao trong phỏng vấn Machine Learning.

Trong bài tập này, bạn sẽ thực hành SVD trên diabetes. Bộ biến đổi này có thể xử lý hiệu quả ma trận thưa (sparse), trái ngược với PCA, và thực hiện giảm chiều tuyến tính bằng cách dùng phân rã giá trị kỳ dị rút gọn (truncated SVD).

Nhắc lại: phân rã giá trị kỳ dị lấy ma trận dữ liệu gốc, phân tách nó thành ba ma trận và dùng chúng để tính và trả về các singular values.

Cùng vị trí trong pipeline nhưng dùng kỹ thuật khác: Machine learning pipeline

Hướng dẫn 1/4

undefined XP
    1
    2
    3
    4
  • Import mô-đun phù hợp để thực hiện SVD.
  • Tạo ma trận đặc trưng X và mảng mục tiêu y với progression từ tập dữ liệu diabetes.