1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Phát hiện gian lận với Python

Connected

Bài tập

Điều chỉnh trọng số trong Voting Classifier

Bạn vừa thấy Voting Classifier có thể giúp cải thiện hiệu quả phát hiện gian lận bằng cách kết hợp ưu điểm của nhiều mô hình. Giờ hãy thử điều chỉnh trọng số mà bạn gán cho các mô hình này. Bằng cách tăng hoặc giảm trọng số, bạn có thể nhấn mạnh mức độ ảnh hưởng của một mô hình so với các mô hình còn lại. Điều này hữu ích khi một mô hình nào đó có hiệu năng tổng thể tốt hơn phần còn lại, nhưng bạn vẫn muốn kết hợp một số khía cạnh của các mô hình khác để tiếp tục cải thiện kết quả.

Trong bài này, dữ liệu đã được chia sẵn thành tập huấn luyện và tập kiểm tra, và clf1, clf2 và clf3 đã có sẵn và được định nghĩa như trước: lần lượt là Logistic Regression, Random Forest và Decision Tree.

Hướng dẫn

100 XP
  • Định nghĩa một phương pháp ensemble trong đó bạn gán trọng số cao hơn cho bộ phân loại thứ hai (clf2), theo tỷ lệ 4 so với 1 cho các bộ phân loại còn lại.
  • Huấn luyện mô hình trên tập huấn luyện và kiểm tra, và lấy dự đoán predicted từ mô hình ensemble.
  • In các chỉ số đánh giá hiệu năng; phần này đã sẵn sàng để bạn chạy.