1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Machine Learning cho Marketing với Python

Connected

Bài tập

Xác định hệ số phạt L1 tối ưu

Bây giờ bạn sẽ tinh chỉnh tham số C cho L1 regularization để tìm giá trị giúp giảm độ phức tạp mô hình mà vẫn duy trì các chỉ số hiệu năng tốt. Bạn sẽ chạy một vòng lặp for qua các giá trị C khả dĩ, xây dựng các mô hình logistic regression tương ứng và tính các chỉ số hiệu năng.

Một list C đã được tạo với các giá trị khả dĩ. Mảng l1_metrics được tạo với 3 cột: cột đầu là các giá trị C, hai cột sau là chỗ giữ chỗ cho số lượng hệ số khác 0 và điểm recall của mô hình. Các đặc trưng đã được chuẩn hóa và biến mục tiêu đã được nạp thành train_X, train_Y cho huấn luyện, và test_X, test_Y cho kiểm tra.

Cả numpy và pandas đã được nạp lần lượt là np và pd, cùng với hàm recall_score từ sklearn.

Hướng dẫn

100 XP
  • Chạy vòng lặp for trên phạm vi từ 0 đến độ dài của list C.
  • Với mỗi ứng viên C, khởi tạo và fit Logistic Regression, rồi dự đoán churn trên dữ liệu kiểm tra.
  • Với mỗi ứng viên C, lưu số lượng hệ số khác 0 và điểm recall vào cột thứ hai và thứ ba của l1_metrics.
  • Tạo một pandas DataFrame từ l1_metrics với các tên cột phù hợp.