Menyetel jumlah fitur
Hyperparameter bawaan yang digunakan oleh model Anda tidak dioptimalkan untuk data Anda. Tujuan grid search cross-validation adalah mengidentifikasi hyperparameter yang menghasilkan kinerja model optimal. Dalam video, Anda melihat bagaimana hyperparameter n_estimators pada random forest disetel. Di sini, Anda akan berlatih menyetel hyperparameter max_features. Hyperparameter cv ditetapkan ke 3 agar kode berjalan cepat.
| Hyperparameter | Tujuan |
|---|---|
| max_features | Jumlah fitur untuk pemisahan terbaik |
Random forest adalah ansambel dari banyak decision tree. Hyperparameter n_estimators mengontrol jumlah pohon yang digunakan dalam forest, sedangkan hyperparameter max_features mengontrol jumlah fitur yang dipertimbangkan random forest saat mencari pemisahan terbaik pada decision tree.
Sebuah random forest classifier telah diinstansiasi untuk Anda sebagai clf.
Latihan ini adalah bagian dari kursus
Analitik Pemasaran: Memprediksi Churn Pelanggan di Python
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Import GridSearchCV