1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Machine Learning cho Marketing với Python

Connected

Bài tập

Xác định độ sâu cây tối ưu

Giờ bạn sẽ tinh chỉnh tham số max_depth của cây quyết định để tìm ra giá trị giúp giảm over-fitting nhưng vẫn giữ được các chỉ số hiệu năng tốt. Bạn sẽ chạy một vòng lặp for qua nhiều giá trị max_depth, huấn luyện một cây quyết định cho mỗi giá trị, rồi tính các chỉ số hiệu năng.

Danh sách depth_list chứa các giá trị ứng viên đã được nạp sẵn cho bạn. Mảng depth_tuning đã được tạo sẵn với 2 cột, trong đó cột đầu chứa các ứng viên độ sâu, và cột kế tiếp là chỗ trống để điền điểm recall. Ngoài ra, các biến đặc trưng và mục tiêu đã được nạp thành train_X, train_Y cho dữ liệu huấn luyện, và test_X, test_Y cho dữ liệu kiểm tra. Cả hai thư viện numpy và pandas đã được nạp lần lượt là np và pd.

Hướng dẫn

100 XP
  • Chạy vòng lặp for trên phạm vi từ 0 đến độ dài của danh sách depth_list.
  • Với mỗi ứng viên độ sâu, khởi tạo và fit một bộ phân loại cây quyết định và dự đoán churn trên dữ liệu kiểm tra.
  • Với mỗi ứng viên độ sâu, tính điểm recall bằng hàm recall_score() và lưu vào cột thứ hai của depth_tunning.
  • Tạo một pandas DataFrame từ depth_tuning với tên cột phù hợp.