1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Unsupervised Learning bằng Python

Connected

Bài tập

Phương sai của các đặc trưng PCA

Bộ dữ liệu cá có 6 chiều. Nhưng số chiều nội tại của nó là bao nhiêu? Hãy vẽ biểu đồ phương sai của các đặc trưng PCA để tìm câu trả lời. Như trước đây, samples là mảng 2D, trong đó mỗi hàng đại diện cho một con cá. Bạn cần chuẩn hóa (standardize) các đặc trưng trước.

Hướng dẫn

100 XP
  • Tạo một instance StandardScaler đặt tên là scaler.
  • Tạo một instance PCA đặt tên là pca.
  • Dùng hàm make_pipeline() để tạo pipeline nối scaler và pca.
  • Dùng phương thức .fit() của pipeline để fit vào các mẫu cá samples.
  • Trích xuất số lượng thành phần được sử dụng bằng thuộc tính .n_components_ của pca. Đưa giá trị này vào hàm range() và lưu kết quả vào features.
  • Dùng hàm plt.bar() để vẽ phương sai giải thích, với features trên trục x và pca.explained_variance_ trên trục y.