Mengestimasi galat uji

Sekarang Anda telah memiliki posterior_predictive (tersedia di ruang kerja Anda), Anda dapat mengevaluasi kinerja model pada data baru. Untuk melakukannya, Anda perlu melakukan perulangan pada observasi uji, dan untuk masing-masing observasi, hitung galat prediksi sebagai selisih antara sebaran prediktif untuk observasi tersebut dan nilai sebenarnya. Ini akan memberikan sebaran galat model Anda, yang kemudian dapat Anda visualisasikan.

Anda akan memerlukan pymc3 dan numpy, yang telah diimpor sebagai pm dan np. Data uji, bikes_test, juga tersedia di ruang kerja Anda. Mari kita mulai!

Latihan ini merupakan bagian dari kursus

Analisis Data Bayesian dengan Python

Instruksi latihan

Inisialisasi errors sebagai list kosong.
Untuk setiap baris di bikes_test, hitung galat prediksi sebagai pengambilan prediktif untuk baris ini dari posterior_predictive dikurangi satu nilai sebenarnya num_bikes dari baris tersebut.
Bentuk ulang errors dengan mengonversinya menjadi array numpy dan menerapkan metode .reshape() pada hasilnya, lalu tetapkan hasil akhir ke error_distribution.
Plot sebaran galat uji menggunakan fungsi plot_posterior() dari pymc3.

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Initialize errors
errors = ____

# Iterate over rows of bikes_test to compute error per row
for index, test_example in bikes_test.iterrows():
    error = ____[____][:, ____] - ____[____]
    errors.append(error)

# Reshape errors
error_distribution = ____(____).____()

# Plot the error distribution
____
plt.show()

Edit dan Jalankan Kode

Latihan ini merupakan bagian dari kursus

Analisis Data Bayesian dengan Python

SkillTag.level.intermediateSkillTag.label

4.8+

Mulai Kursus Gratis

Ambil langkah pertama Anda di dunia Bayesian. Pada bab ini, Anda akan diperkenalkan pada konsep dasar probabilitas dan sebaran statistik, serta Teorema Bayes yang terkenal, landasan metode Bayesian. Terakhir, Anda akan membangun model Bayesian pertama Anda untuk menarik kesimpulan dari pelemparan koin acak.

Exercise 1: Siapa Bayes? Apa itu Bayes?Exercise 2: Bayesian vs. Frequentist Exercise 3: Sebaran probabilitas Exercise 4: Probabilitas dan Teorema Bayes Exercise 5: Ayo bermain kartu Exercise 6: Filter spam Bayesian Exercise 7: Apa kata hasil tes?Exercise 8: Mencicipi Bayes Exercise 9: Melempar koin Exercise 10: Semakin sering Anda melempar, semakin banyak Anda belajar Exercise 11: Hei, apakah koin ini adil?

Saatnya melihat lebih dalam pendekatan Bayesian. Anda akan belajar menerapkan Teorema Bayes pada data efektivitas obat untuk mengestimasi parameter sebaran probabilitas menggunakan teknik pendekatan grid, serta memperbarui estimasi tersebut saat data baru tersedia. Selanjutnya, Anda akan mempelajari cara memasukkan pengetahuan awal (prior) ke dalam model dan akhirnya melatih keterampilan penting melaporkan hasil kepada audiens nonteknis.

Exercise 1: Membongkar dapur Bayesian Exercise 2: Menuju pendekatan grid Exercise 3: Pendekatan grid tanpa pengetahuan awal Exercise 4: Memperbarui keyakinan posterior Exercise 5: Kepercayaan awal Exercise 6: Kebenaran tentang prior Exercise 7: Memilih prior yang tepat Exercise 8: Mensimulasikan pengambilan sampel posterior Exercise 9: Melaporkan hasil Bayesian Exercise 10: Estimasi titik Exercise 11: Interval kredibel Highest Posterior Density Exercise 12: Makna kredibilitas

Terapkan keterampilan analisis data Bayesian yang baru Anda kuasai untuk memecahkan tantangan bisnis dunia nyata. Anda akan bekerja dengan data pemasaran penjualan online untuk melakukan A/B testing, analisis keputusan, dan peramalan dengan model regresi linear.

Exercise 1: Pengujian A/B Exercise 2: Simulasikan posterior beta Exercise 3: Laju klik posterior Exercise 4: A atau B, dan seberapa yakinkah kita?Exercise 5: Seberapa buruk kemungkinan terburuknya?Exercise 6: Analisis keputusan Exercise 7: Analisis keputusan: biaya Exercise 8: Analisis keputusan: laba Exercise 9: Regresi dan peramalan Exercise 10: Mendefinisikan model regresi Bayesian Exercise 11: Menganalisis parameter regresi Exercise 12: Distribusi prediktif

Pada bab terakhir ini, Anda akan memanfaatkan paket PyMC3 yang andal untuk dengan mudah menyesuaikan model regresi Bayesian, melakukan pemeriksaan kewarasan terhadap konvergensi model, memilih di antara model yang bersaing, dan menghasilkan prediksi untuk data baru. Sebagai penutup, Anda akan menerapkan yang telah dipelajari untuk menemukan harga optimal alpukat dalam studi kasus analisis data Bayesian. Semoga sukses!

Exercise 1: Markov Chain Monte Carlo dan pemodelan Exercise 2: Markov Chain Monte Carlo Exercise 3: Melakukan sampling dari posterior Exercise 4: Menafsirkan hasil dan membandingkan model Exercise 5: Memeriksa sampel posterior Exercise 6: Membandingkan model dengan WAIC Exercise 7: Membuat prediksi Exercise 8: Sampel dari kerapatan prediktif Exercise 9: Mengestimasi galat uji

Latihan Saat Ini

Exercise 10: Berapa harga sebuah alpukat?Exercise 11: Memasang model Exercise 12: Memeriksa model Exercise 13: Mengoptimalkan harga Exercise 14: Catatan penutup