Regularization

Regularization là quá trình bổ sung thông tin vào mô hình để ngăn overfitting. Điều này quan trọng để cải thiện các chỉ số đánh giá bạn đã thấy ở đầu chương. Trong bài tập này, bạn sẽ thay đổi tham số độ sâu tối đa của cây quyết định để xem kết quả phân loại bị ảnh hưởng như thế nào.

X_train, y_train, X_test, y_test đã có sẵn trong không gian làm việc của bạn. pandas là pd, numpy là np, và sklearn cũng có sẵn. Ngoài ra, confusion_matrix(), precision_score(), và recall_score() từ sklearn.metrics cũng có sẵn.

Tạo các cây quyết định khác nhau bằng cách thay đổi độ sâu tối đa của mỗi cây.
Với mỗi cây, fit và tạo dự đoán trên dữ liệu kiểm tra.
Đánh giá ma trận nhầm lẫn (confusion matrix), precision và recall cho mỗi cây.

Bài tập

Regularization

Hướng dẫn

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}Bài tập

Hướng dẫn

Bài tập