1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Giảm Chiều Dữ Liệu với Python

Connected

Bài tập

PCA trong pipeline mô hình

Bạn vừa thấy rằng các Pokemon huyền thoại thường có chỉ số tổng thể cao hơn. Hãy thử thêm một bộ phân loại vào pipeline để phát hiện Pokemon huyền thoại so với không huyền thoại dựa trên các thành phần chính.

Dữ liệu đã được nạp sẵn và tách thành tập huấn luyện và kiểm tra: X_train, X_test, y_train, y_test.

Tương tự, mọi gói và lớp liên quan (Pipeline(), StandardScaler(), PCA(), RandomForestClassifier()) cũng đã sẵn sàng.

Hướng dẫn 1/4

undefined XP
    1
    2
    3
    4
  • Thêm bộ chuẩn hóa, PCA giới hạn 2 thành phần, và bộ phân loại rừng ngẫu nhiên với random_state=0 vào pipeline.