Memilih model precision terbaik
Atasan Anda bersedia membiayai Anda untuk menonton tiga pertandingan olahraga tahun ini. Dari 41 pertandingan kandang yang dimainkan tim favorit Anda, Anda ingin memastikan Anda menghadiri tiga pertandingan kandang yang mereka pasti menangkan. Anda membangun sebuah model untuk memutuskan pertandingan mana yang akan dimenangkan tim Anda.
Untuk itu, Anda akan membangun algoritma pencarian acak dan berfokus pada precision model (untuk memastikan tim Anda menang). Anda juga ingin mencatat model terbaik dan parameter terbaik, agar dapat menggunakannya lagi tahun depan (tentu saja jika modelnya bagus). Anda sudah memutuskan untuk menggunakan model klasifikasi random forest rfc dan telah membuat sebaran parameter param_dist.
Latihan ini adalah bagian dari kursus
Validasi Model di Python
Petunjuk latihan
- Buat scorer precision,
precisionmenggunakanmake_scorer(<scoring_function>). - Lengkapi metode pencarian acak dengan menggunakan
rfcdanparam_dist. - Gunakan
rs.cv_results_untuk mencetak skor uji rata-rata. - Cetak skor keseluruhan terbaik.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
from sklearn.metrics import precision_score, make_scorer
# Create a precision scorer
precision = ____(____)
# Finalize the random search
rs = RandomizedSearchCV(
estimator=____, param_distributions=____,
scoring = precision,
cv=5, n_iter=10, random_state=1111)
rs.fit(X, y)
# print the mean test scores:
print('The accuracy for each run was: {}.'.format(rs.cv_results_['____']))
# print the best model score:
print('The best accuracy for a single model was: {}'.format(rs.____))