1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Luyện tập câu hỏi phỏng vấn Machine Learning bằng Python

Connected

Bài tập

Trực quan hóa sự tách biệt lớp bằng PCA I

Một câu hỏi thường gặp trong phỏng vấn Machine Learning là cách trực quan hóa dữ liệu sau khi áp dụng PCA. Trong bài tập này, bạn sẽ làm điều đó bằng cách vẽ 2 thành phần chính đầu tiên của loan_data để quan sát mức độ tách biệt giữa các lớp theo việc khoản vay đã được hoàn tất thanh toán hay bị xóa nợ.

Bộ dữ liệu loan_data đã được scale và one-hot encode, nghĩa là các biến phân loại đã được chuyển thành biến nhị phân, vì các đặc trưng cần cùng thang đo và ở dạng số trước khi thực hiện PCA.

Một mô hình PCA với 2 thành phần chính và phần thiết lập biểu đồ với nhãn trục x, y và tiêu đề đã được chuẩn bị sẵn cho bạn. Bạn sẽ sử dụng DataFrame tên loan_data_PCA trong bài tập. Các giá trị có thể có của biến mục tiêu Loan Status là 0 và 1. Bạn sẽ vẽ PC1 trên trục x và PC2 trên trục y.

Đã được import sẵn cho bạn: matplotlib.pyplot là plt, seaborn là sns, PCA từ sklearn.decomposition.

Hướng dẫn 1/3

undefined XP
    1
    2
    3
  • Gán các giá trị của biến mục tiêu vào danh sách targets.
  • Truyền các danh sách vừa tạo vào hàm zip() bên trong vòng lặp for.
  • Truyền các dòng có Loan Status bằng target vào indicesToKeep.