Tìm kiếm ngẫu nhiên

# Call GridSearchCV
grid_search = GridSearchCV(clf, param_grid)

# Fit the model
grid_search.fit(X, y)

Trong đoạn mã trên từ bài tập trước, bạn có thể nhận thấy dòng mã đầu tiên chạy rất nhanh, trong khi lệnh gọi .fit() mất vài giây để thực thi.

Đó là vì .fit() mới là bước thực hiện grid search, và trong trường hợp của chúng ta, lưới có rất nhiều tổ hợp khác nhau. Khi lưới siêu tham số càng lớn, grid search sẽ càng chậm. Để giải quyết vấn đề này, thay vì thử mọi tổ hợp giá trị, chúng ta có thể nhảy ngẫu nhiên trong lưới và thử các tổ hợp khác nhau. Có một khả năng nhỏ là ta bỏ lỡ tổ hợp tốt nhất, nhưng đổi lại sẽ tiết kiệm rất nhiều thời gian, hoặc có thể tinh chỉnh nhiều siêu tham số hơn trong cùng một khoảng thời gian.

Trong scikit-learn, bạn có thể làm điều này bằng RandomizedSearchCV. API của nó giống GridSearchCV, ngoại trừ việc bạn cần chỉ định một phân phối tham số để mẫu ngẫu nhiên thay vì liệt kê các giá trị siêu tham số cụ thể. Hãy thử ngay bây giờ! Phân phối tham số đã được thiết lập sẵn cho bạn, cùng với một bộ phân loại random forest tên là clf.

Import RandomizedSearchCV từ sklearn.model_selection.

Bài tập

Tìm kiếm ngẫu nhiên

Hướng dẫn 1/3

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}Bài tập

Hướng dẫn 1/3

Bài tập