1. Learn
  2. /
  3. Cursuri
  4. /
  5. Analiza bayesiană a datelor în Python

Connected

exercițiu

Estimarea erorii pe datele de test

Acum că ai posterior_predictive disponibil în spațiul de lucru, poți evalua performanța modelului pe date noi. Pentru aceasta, va trebui să parcurgi observațiile de test și, pentru fiecare dintre ele, să calculezi eroarea de predicție ca diferența dintre distribuția predictivă pentru acea observație și valoarea reală. Astfel vei obține distribuția erorii modelului, pe care o poți vizualiza ulterior.

Vei avea nevoie de pymc3 și numpy, care au fost importate pentru tine ca pm, respectiv np. Datele de test, bikes_test, sunt de asemenea disponibile în spațiul de lucru. Să ne apucăm de treabă!

Instrucțiuni

100 XP
  • Inițializează errors ca o listă goală.
  • Pentru fiecare rând din bikes_test, calculează eroarea de predicție ca diferența dintre eșantioanele predictive pentru acel rând din posterior_predictive și valoarea reală unică a lui num_bikes din rând.
  • Restructurează errors convertindu-le într-un array numpy și aplicând metoda .reshape() rezultatului, apoi atribuie rezultatul final variabilei error_distribution.
  • Vizualizează distribuția erorii pe datele de test folosind funcția plot_posterior() din pymc3.