1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Machine Learning với mô hình dựa trên cây trong Python

Connected

Bài tập

Trực quan hóa mức độ quan trọng của đặc trưng

Trong bài tập này, bạn sẽ xác định những đặc trưng nào có tính dự đoán cao nhất theo bộ random forests regressor rf mà bạn đã huấn luyện ở bài trước.

Để làm điều đó, bạn sẽ vẽ một biểu đồ thanh ngang thể hiện mức độ quan trọng của đặc trưng do rf đánh giá. May mắn là việc này khá dễ nhờ khả năng vẽ của pandas.

Chúng tôi đã tạo một đối tượng pandas.Series tên là importances, trong đó chứa tên đặc trưng ở index và giá trị mức độ quan trọng tương ứng. Ngoài ra, matplotlib.pyplot đã được nạp sẵn dưới tên plt và pandas là pd.

Hướng dẫn

100 XP
  • Gọi phương thức .sort_values() trên importances và gán kết quả cho importances_sorted.

  • Gọi phương thức .plot() trên importances_sorted và thiết lập các tham số:

    • kind là 'barh'
    • color là 'lightgreen'