1. Learn
  2. /
  3. Courses
  4. /
  5. Luyện tập câu hỏi phỏng vấn Machine Learning bằng Python

Connected

Exercise

Kỹ thuật đa cộng tuyến - PCA

Trong bài tập trước, bạn đã dùng kỹ thuật tạo đặc trưng để kết hợp hai biến độc lập s1 và s2 thành s1_s2 vì chúng có tương quan cao nhất trong bộ dữ liệu diabetes.

Trong bài này, bạn sẽ thực hiện PCA trên diabetes để loại bỏ đa cộng tuyến trước khi áp dụng Linear Regression. Sau đó, bạn sẽ so sánh các chỉ số đầu ra với bài tập trước. Cuối cùng, bạn sẽ trực quan hóa ma trận tương quan và heatmap của bộ dữ liệu, vì PCA loại bỏ hoàn toàn đa cộng tuyến.

Instructions 1/3

undefined XP
  • 1
    • Import các mô-đun cần thiết để thực hiện PCA.
    • Khởi tạo và fit.
    • Transform tập train và test riêng biệt.
  • 2
    • Khởi tạo, fit và predict một Linear Regression trên bộ dữ liệu đã biến đổi bằng PCA.
    • In các hệ số mô hình, MSE và r-squared.
  • 3
    • Tạo ma trận tương quan và vẽ heatmap.
    • In ma trận để khám phá mối quan hệ giữa các biến độc lập.