MulaiMulai sekarang secara gratis

Mengestimasi galat uji

Sekarang Anda telah memiliki posterior_predictive (tersedia di ruang kerja Anda), Anda dapat mengevaluasi kinerja model pada data baru. Untuk melakukannya, Anda perlu melakukan perulangan pada observasi uji, dan untuk masing-masing observasi, hitung galat prediksi sebagai selisih antara sebaran prediktif untuk observasi tersebut dan nilai sebenarnya. Ini akan memberikan sebaran galat model Anda, yang kemudian dapat Anda visualisasikan.

Anda akan memerlukan pymc3 dan numpy, yang telah diimpor sebagai pm dan np. Data uji, bikes_test, juga tersedia di ruang kerja Anda. Mari kita mulai!

Latihan ini adalah bagian dari kursus

Analisis Data Bayesian dengan Python

Lihat Kursus

Petunjuk latihan

  • Inisialisasi errors sebagai list kosong.
  • Untuk setiap baris di bikes_test, hitung galat prediksi sebagai pengambilan prediktif untuk baris ini dari posterior_predictive dikurangi satu nilai sebenarnya num_bikes dari baris tersebut.
  • Bentuk ulang errors dengan mengonversinya menjadi array numpy dan menerapkan metode .reshape() pada hasilnya, lalu tetapkan hasil akhir ke error_distribution.
  • Plot sebaran galat uji menggunakan fungsi plot_posterior() dari pymc3.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Initialize errors
errors = ____

# Iterate over rows of bikes_test to compute error per row
for index, test_example in bikes_test.iterrows():
    error = ____[____][:, ____] - ____[____]
    errors.append(error)

# Reshape errors
error_distribution = ____(____).____()

# Plot the error distribution
____
plt.show()
Edit dan Jalankan Kode