1. Learn
  2. /
  3. Courses
  4. /
  5. Luyện tập câu hỏi phỏng vấn Machine Learning bằng Python

Connected

Exercise

Một khu rừng các cây quyết định

Trong bài tập này, bạn sẽ luyện tập sử dụng Decision Tree với bootstrap, thường được gọi là Random Forest. Tương tự bài trước, bạn sẽ so sánh độ chính xác của nó với một mô hình đã tinh chỉnh siêu tham số bằng cross-validation.

Lần này, bạn sẽ tinh chỉnh thêm một siêu tham số, max_features, cho phép mô hình quyết định số lượng đặc trưng sẽ dùng. Khi không thiết lập cụ thể, nó mặc định là auto. Một điều cần nhớ cho phỏng vấn: Decision Tree mặc định xét tất cả đặc trưng, trong khi Random Forest thường xét căn bậc hai của số lượng đặc trưng.

Ma trận đặc trưng X, nhãn mục tiêu y, và train_test_split từ sklearn.model_selection đã được nhập sẵn cho bạn.

Instructions 1/2

undefined XP
  • 1
    • Import hàm phù hợp cho bộ phân loại random forest và chia dữ liệu thành tập train và test.
    • Khởi tạo một bộ phân loại random forest, fit, dự đoán, và in ra độ chính xác.
  • 2
    • Import hàm phù hợp để thực hiện grid search có cross-validation.
    • Thực hiện lại các bước tương tự, lần này kết hợp cross-validated grid search.