1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Thiết kế quy trình Machine Learning bằng Python

Connected

Bài tập

Ngưỡng mặc định

Bạn muốn xác nhận rằng DecisionTreeClassifier() dùng cùng một ngưỡng phân loại mặc định như đã đề cập ở bài trước, cụ thể là 0.5. Việc tất cả classifier đều dùng cùng một ngưỡng nghe có vẻ lạ. Hãy kiểm tra! Một bộ phân loại cây quyết định đã được huấn luyện clf đã được nạp sẵn cho bạn, cùng với dữ liệu huấn luyện và kiểm tra với các tên quen thuộc: X_train, X_test, y_train và y_test. Bạn sẽ cần trích xuất xác suất từ bộ phân loại bằng phương thức .predict_proba().

Hướng dẫn

100 XP
  • Tạo điểm số cho các mẫu kiểm tra bằng bộ phân loại clf đã nạp sẵn.
  • Bây giờ trích xuất nhãn từ các điểm số. Hãy nhớ rằng bạn có một cặp điểm số cho mỗi mẫu, không phải một điểm số duy nhất, và phần tử thứ hai là xác suất của lớp dương.
  • Tiếp theo, gán nhãn cho dữ liệu kiểm tra bằng phương thức chuẩn .predict()
  • Cuối cùng, so sánh với các dự đoán bạn có trước đó. Chúng có giống hệt nhau không?