Mengestimasi galat uji
Sekarang Anda telah memiliki posterior_predictive (tersedia di ruang kerja Anda), Anda dapat mengevaluasi kinerja model pada data baru. Untuk melakukannya, Anda perlu melakukan perulangan pada observasi uji, dan untuk masing-masing observasi, hitung galat prediksi sebagai selisih antara sebaran prediktif untuk observasi tersebut dan nilai sebenarnya. Ini akan memberikan sebaran galat model Anda, yang kemudian dapat Anda visualisasikan.
Anda akan memerlukan pymc3 dan numpy, yang telah diimpor sebagai pm dan np. Data uji, bikes_test, juga tersedia di ruang kerja Anda. Mari kita mulai!
Latihan ini adalah bagian dari kursus
Analisis Data Bayesian dengan Python
Petunjuk latihan
- Inisialisasi
errorssebagai list kosong. - Untuk setiap baris di
bikes_test, hitung galat prediksi sebagai pengambilan prediktif untuk baris ini dariposterior_predictivedikurangi satu nilai sebenarnyanum_bikesdari baris tersebut. - Bentuk ulang
errorsdengan mengonversinya menjadi arraynumpydan menerapkan metode.reshape()pada hasilnya, lalu tetapkan hasil akhir keerror_distribution. - Plot sebaran galat uji menggunakan fungsi
plot_posterior()daripymc3.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Initialize errors
errors = ____
# Iterate over rows of bikes_test to compute error per row
for index, test_example in bikes_test.iterrows():
error = ____[____][:, ____] - ____[____]
errors.append(error)
# Reshape errors
error_distribution = ____(____).____()
# Plot the error distribution
____
plt.show()