1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Gradient Boosting Cực Mạnh với XGBoost

Connected

Bài tập

Trực quan hóa mức độ quan trọng của đặc trưng: Những đặc trưng nào quan trọng nhất trong dữ liệu của tôi

Một cách khác để trực quan hóa các mô hình XGBoost là xem xét mức độ quan trọng của từng cột đặc trưng trong bộ dữ liệu gốc bên trong mô hình.

Một cách đơn giản là đếm số lần mỗi đặc trưng được dùng để tách (split) trên tất cả các vòng boosting (các cây) trong mô hình, rồi vẽ kết quả dưới dạng biểu đồ cột, với thứ tự đặc trưng theo số lần xuất hiện. XGBoost có hàm plot_importance() cho phép bạn làm chính xác điều này, và bạn sẽ có dịp sử dụng nó trong bài tập này!

Hướng dẫn

100 XP
  • Tạo DMatrix từ X và y như trước.
  • Tạo một từ điển tham số với "objective" phù hợp ("reg:squarederror") và "max_depth" bằng 4.
  • Huấn luyện mô hình với 10 vòng boosting, giống hệt như bạn đã làm ở bài trước.
  • Dùng xgb.plot_importance() và truyền vào mô hình đã huấn luyện để tạo biểu đồ mức độ quan trọng của đặc trưng.