MulaiMulai sekarang secara gratis

Pencarian grid

Penyetelan hyperparameter dapat dilakukan oleh sklearn dengan menyediakan berbagai parameter masukan, yang masing-masing dapat dienkode menggunakan berbagai fungsi dari numpy. Salah satu metode penyetelan, yang secara menyeluruh meninjau semua kombinasi hyperparameter masukan yang ditentukan melalui param_grid, adalah grid search. Pada latihan ini, Anda akan menggunakan grid search untuk menelusuri hyperparameter bagi sebuah contoh random forest classifier dengan fungsi penilaian berupa AUC dari kurva ROC.

X_train, y_train, X_test, y_test tersedia di workspace Anda. pandas sebagai pd, numpy sebagai np, dan sklearn juga tersedia di workspace Anda. Selain itu, GridSearchCV() dari sklearn.model_selection tersedia.

Latihan ini adalah bagian dari kursus

Memprediksi CTR dengan Machine Learning di Python

Lihat Kursus

Petunjuk latihan

  • Buat daftar nilai untuk setiap hyperparameter pada n_estimators dan max_depth.
  • Buat sebuah random forest classifier.
  • Siapkan grid search untuk mengiterasi semua kombinasi hyperparameter.
  • Cetak skor AUC terbaik menggunakan .best_score_, dan estimator terbaik yang menghasilkan skor ini menggunakan .best_estimator_.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Create list of hyperparameters 
n_estimators = [10, 50]
max_depth = [5, 20]
param_grid = {'n_estimators': ____, 'max_depth': ____}

# Use Grid search CV to find best parameters 
print("starting RF grid search.. ")
rf = ____()
clf = ____(estimator = rf, param_grid = ____, scoring = 'roc_auc')
clf.fit(X_train, y_train)
print("Best Score: ")
print(clf.____)
print("Best Estimator: ")
print(clf.____)
Edit dan Jalankan Kode