Pencarian grid
Penyetelan hyperparameter dapat dilakukan oleh sklearn dengan menyediakan berbagai parameter masukan, yang masing-masing dapat dienkode menggunakan berbagai fungsi dari numpy. Salah satu metode penyetelan, yang secara menyeluruh meninjau semua kombinasi hyperparameter masukan yang ditentukan melalui param_grid, adalah grid search. Pada latihan ini, Anda akan menggunakan grid search untuk menelusuri hyperparameter bagi sebuah contoh random forest classifier dengan fungsi penilaian berupa AUC dari kurva ROC.
X_train, y_train, X_test, y_test tersedia di workspace Anda. pandas sebagai pd, numpy sebagai np, dan sklearn juga tersedia di workspace Anda. Selain itu, GridSearchCV() dari sklearn.model_selection tersedia.
Latihan ini adalah bagian dari kursus
Memprediksi CTR dengan Machine Learning di Python
Petunjuk latihan
- Buat daftar nilai untuk setiap hyperparameter pada
n_estimatorsdanmax_depth. - Buat sebuah random forest classifier.
- Siapkan grid search untuk mengiterasi semua kombinasi hyperparameter.
- Cetak skor AUC terbaik menggunakan
.best_score_, dan estimator terbaik yang menghasilkan skor ini menggunakan.best_estimator_.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create list of hyperparameters
n_estimators = [10, 50]
max_depth = [5, 20]
param_grid = {'n_estimators': ____, 'max_depth': ____}
# Use Grid search CV to find best parameters
print("starting RF grid search.. ")
rf = ____()
clf = ____(estimator = rf, param_grid = ____, scoring = 'roc_auc')
clf.fit(X_train, y_train)
print("Best Score: ")
print(clf.____)
print("Best Estimator: ")
print(clf.____)