1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Unsupervised Learning bằng Python

Connected

Bài tập

Thành phần chính thứ nhất

Thành phần chính thứ nhất của dữ liệu là hướng mà dữ liệu biến thiên nhiều nhất. Trong bài tập này, nhiệm vụ của bạn là dùng PCA để tìm thành phần chính thứ nhất từ số đo chiều dài và chiều rộng của các mẫu hạt, và biểu diễn nó bằng một mũi tên trên biểu đồ scatter.

Mảng grains chứa chiều dài và chiều rộng của các mẫu hạt. PyPlot (plt) và PCA đã được nhập sẵn cho bạn.

Hướng dẫn

100 XP
  • Vẽ biểu đồ scatter cho các số đo của hạt. Việc này đã được làm sẵn cho bạn.
  • Tạo một thể hiện PCA tên là model.
  • Fit mô hình với dữ liệu grains.
  • Trích xuất tọa độ trung bình của dữ liệu bằng thuộc tính .mean_ của model.
  • Lấy thành phần chính thứ nhất của model bằng thuộc tính .components_[0,:].
  • Vẽ thành phần chính thứ nhất dưới dạng một mũi tên trên biểu đồ scatter, dùng hàm plt.arrow(). Bạn cần chỉ định hai đối số đầu tiên — mean[0] và mean[1].