1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Thiết kế quy trình Machine Learning bằng Python

Connected

Bài tập

Tìm kiếm lưới (Grid search) k-fold CV cho độ phức tạp mô hình

Trong slide trước, bạn đã thấy hầu hết các bộ phân loại đều có một hoặc vài siêu tham số kiểm soát độ phức tạp. Bạn cũng đã học cách tinh chỉnh chúng bằng GridSearchCV(). Ở bài tập này, bạn sẽ luyện tập thuần thục kỹ năng đó. Bạn sẽ thử nghiệm với:

  • Số lượng cây, n_estimators, trong RandomForestClassifier.
  • Độ sâu tối đa, max_depth, của các cây quyết định dùng trong AdaBoostClassifier.
  • Số lượng láng giềng gần nhất, n_neighbors, trong KNeighborsClassifier.

Hướng dẫn 1/3

undefined XP
  • 1

    Xác định lưới tham số như mô tả trong phần chú thích mã và tạo một đối tượng grid với RandomForestClassifier().

  • 2

    Điều chỉnh mã của bạn để tối ưu n_estimators cho AdaBoostClassifier().

  • 3

    Điều chỉnh mã của bạn để tối ưu n_neighbors cho KNeighborsClassifier().