Penyetelan Hyperparameter Genetik dengan TPOT
Anda akan mengerjakan contoh sederhana penyetelan hyperparameter berbasis genetik. TPOT adalah pustaka yang sangat kuat dengan banyak fitur. Pada pelajaran ini Anda baru menyentuh permukaannya, namun sangat dianjurkan untuk mengeksplorasinya sendiri di waktu Anda.
Ini hanyalah contoh kecil. Dalam praktiknya, TPOT dirancang untuk dijalankan berjam-jam guna menemukan model terbaik. Anda akan menggunakan ukuran populasi dan keturunan yang jauh lebih besar serta ratusan generasi untuk menemukan model yang baik.
Anda akan membuat estimator, melakukan fit estimator pada data pelatihan, lalu menilai kinerjanya pada data uji.
Untuk contoh ini kita akan menggunakan:
- 3 generasi
- ukuran populasi 4
- 3 keturunan di setiap generasi
- accuracy untuk penilaian
random_state bernilai 2 telah ditetapkan agar hasil konsisten.
Latihan ini adalah bagian dari kursus
Penyetelan Hyperparameter di Python
Petunjuk latihan
- Tetapkan nilai yang diuraikan dalam konteks ke masukan untuk
tpot_clf. - Buat classifier
tpot_clfdengan masukan yang benar. - Lakukan fit classifier pada data pelatihan (
X_train&y_traintersedia di workspace Anda). - Gunakan classifier yang telah di-fit untuk memberi skor pada himpunan uji (
X_test&y_testtersedia di workspace Anda).
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Assign the values outlined to the inputs
number_generations = ____
population_size = ____
offspring_size = ____
scoring_function = ____
# Create the tpot classifier
tpot_clf = TPOTClassifier(generations=____, population_size=____,
offspring_size=____, scoring=____,
verbosity=2, random_state=2, cv=2)
# Fit the classifier to the training data
____.____(____, ____)
# Score on the test set
print(____.____(____, ____))