1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Thiết kế quy trình Machine Learning bằng Python

Connected

Bài tập

Bộ biến đổi hàm tùy chỉnh trong pipelines

Có thời điểm bạn được thông báo rằng các cảm biến có thể hoạt động kém với những người béo phì. Trước đây bạn đã xử lý điều đó bằng trọng số, nhưng giờ bạn nghĩ thông tin này cũng có thể hữu ích cho việc tạo đặc trưng, nên bạn quyết định thay thế cân nặng ghi nhận của một cá nhân bằng một biến chỉ báo xem họ có béo phì hay không. Bạn muốn làm điều này bằng pipelines. Bạn có numpy dưới tên np, RandomForestClassifier(), FunctionTransformer(), và GridSearchCV().

Hướng dẫn

100 XP
  • Định nghĩa một bộ trích xuất đặc trưng tùy chỉnh. Đây là một hàm sẽ xuất ra một bản sao đã được chỉnh sửa của đầu vào.
  • Thay mỗi giá trị ở cột thứ nhất bằng chỉ báo xem giá trị đó có vượt quá một ngưỡng được cho bởi bội số của trung bình cột hay không.
  • Chuyển bộ trích xuất đặc trưng ở trên thành một transformer và đặt nó vào một pipeline cùng với một bộ phân loại random forest.
  • Dùng grid search CV để thử các giá trị 1, 2 và 3 cho hằng số nhân multiplier trong bộ trích xuất đặc trưng của bạn.