1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Giảm Chiều Dữ Liệu với Python

Connected

Bài tập

Xây dựng mô hình random forest

Bạn sẽ tiếp tục làm việc với bộ dữ liệu Pima Indians để dự đoán một cá nhân có mắc bệnh tiểu đường hay không, lần này dùng bộ phân loại random forest. Bạn sẽ huấn luyện mô hình trên dữ liệu huấn luyện sau khi tách train-test và xem các giá trị mức độ quan trọng của đặc trưng.

Các tập dữ liệu đặc trưng và mục tiêu đã được nạp sẵn là X và y. Các gói và hàm cần thiết cũng đã được chuẩn bị sẵn.

Hướng dẫn

100 XP
  • Đặt tỷ lệ kiểm tra 25% để thực hiện tách train-test theo tỷ lệ 75%-25%.
  • Huấn luyện bộ phân loại random forest trên dữ liệu huấn luyện.
  • Tính độ chính xác trên tập kiểm tra.
  • In mức độ quan trọng của từng đặc trưng.