GridSearchCV dengan Scikit Learn
Modul GridSearchCV dari Scikit Learn menyediakan banyak fitur berguna untuk membantu melakukan grid search secara efisien. Sekarang Anda akan mempraktikkan pembelajaran Anda dengan membuat objek GridSearchCV dengan parameter tertentu.
Opsi yang diinginkan adalah:
- Estimator Random Forest, dengan kriteria pemisahan 'entropy'
- Validasi silang 5-fold
- Hyperparameter
max_depth(2, 4, 8, 15) danmax_features('auto' vs 'sqrt') - Gunakan
roc_aucuntuk menilai model - Gunakan 4 core untuk pemrosesan paralel
- Pastikan Anda melakukan refit pada model terbaik dan mengembalikan skor pelatihan
Anda akan memiliki himpunan data X_train, X_test, y_train, dan y_test.
Latihan ini adalah bagian dari kursus
Penyetelan Hyperparameter di Python
Petunjuk latihan
- Buat estimator Random Forest seperti yang ditentukan pada konteks di atas.
- Buat parameter grid seperti yang ditentukan pada konteks di atas.
- Buat objek
GridSearchCVseperti yang diuraikan pada konteks di atas, menggunakan dua elemen yang dibuat pada dua instruksi sebelumnya.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create a Random Forest Classifier with specified criterion
rf_class = RandomForestClassifier(____=____)
# Create the parameter grid
param_grid = {____: ____, ____: ____}
# Create a GridSearchCV object
grid_rf_class = GridSearchCV(
estimator=____,
param_grid=____,
scoring=____,
n_jobs=____,
cv=____,
refit=____, return_train_score=____)
print(grid_rf_class)