1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Luyện tập câu hỏi phỏng vấn Machine Learning bằng Python

Connected

Bài tập

Cây quyết định

Trong ba chương trước, bạn đã học nhiều kỹ thuật giúp xử lý các khía cạnh khác nhau của phỏng vấn Machine Learning. Ở chương này, bạn sẽ được giới thiệu các cách đảm bảo bất kỳ mô hình nào bạn được yêu cầu xây dựng hoặc thảo luận trong buổi phỏng vấn Machine Learning đều có khả năng khái quát hóa tốt, được đánh giá đúng cách và được lựa chọn phù hợp trong số các mô hình khả dĩ khác.

Trong bài tập này, bạn sẽ đi sâu vào tinh chỉnh siêu tham số (hyperparameter tuning) cho một cây quyết định trên bộ dữ liệu loan_data. Tại đây, bạn sẽ tinh chỉnh min_samples_split (số lượng mẫu tối thiểu cần có để tạo thêm một nhánh nhị phân) và max_depth (độ sâu tối đa của cây). Cây càng sâu thì càng có nhiều lần chia, từ đó nắm bắt nhiều thông tin hơn về dữ liệu.

Ma trận đặc trưng X và nhãn mục tiêu y đã được nhập sẵn cho bạn.

Lưu ý rằng một lần nữa bạn đang thực hiện toàn bộ các bước trong quy trình Machine Learning!

Machine learning pipeline

Hướng dẫn 1/2

undefined XP
  • 1
    • Import hàm phù hợp cho bộ phân loại cây quyết định và tách dữ liệu thành tập huấn luyện và kiểm tra.
    • Khởi tạo một bộ phân loại cây quyết định, fit, dự đoán và in độ chính xác.
  • 2
    • Import hàm phù hợp để thực hiện grid search kèm cross-validation.
    • Khởi tạo một bộ phân loại cây quyết định và sử dụng nó với lưới tham số để thực hiện grid search có cross-validation.
    • Fit và in các chỉ số đánh giá mô hình