Mengeksplorasi Hyperparameter Random Forest
Memahami hyperparameter yang tersedia dan dampak masing-masing hyperparameter merupakan keterampilan inti bagi setiap data scientist. Seiring model menjadi lebih kompleks, ada banyak pengaturan yang dapat Anda tetapkan, tetapi hanya sebagian yang akan berdampak besar pada model Anda.
Sekarang Anda akan menilai model random forest yang sudah ada (model tersebut memiliki beberapa pilihan hyperparameter yang kurang baik!) lalu membuat pilihan yang lebih baik untuk model random forest baru dan menilai kinerjanya.
Anda akan memiliki:
- DataFrame
X_train,X_test,y_train,y_test - Estimator random forest terlatih sebelumnya,
rf_clf_old - Prediksi dari estimator random forest yang ada pada himpunan uji,
rf_old_predictions
Latihan ini adalah bagian dari kursus
Penyetelan Hyperparameter di Python
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Print out the old estimator, notice which hyperparameter is badly set
print(____)
# Get confusion matrix & accuracy for the old rf_model
print("Confusion Matrix: \n\n {} \n Accuracy Score: \n\n {}".format(
confusion_matrix(____, ____),
accuracy_score(____, ____)))