Stime puntuali a posteriori
Ricorda la verosimiglianza del modello di regressione bayesiana del peso \(Y\) in funzione dell’altezza \(X\): \(Y \sim N(m, s^2)\) dove \(m = a + b X\). Una simulazione RJAGS della posteriore con 100.000 iterazioni, weight_sim_big, è nel tuo workspace insieme a un data frame con l’output della catena di Markov:
> head(weight_chains, 2)
a b s iter
1 -113.9029 1.072505 8.772007 1
2 -115.0644 1.077914 8.986393 2
Le medie a posteriori dei parametri intercetta e pendenza, \(a\) e \(b\), riflettono l’andamento medio a posteriori della relazione tra peso e altezza. Al contrario, le posteriori complete di \(a\) e \(b\) riflettono l’intervallo dei parametri plausibili, dunque l’incertezza a posteriori sull’andamento. Qui sotto esaminerai sia l’andamento sia la sua incertezza. I dati bdims sono nel tuo workspace.
Questo esercizio fa parte del corso
Modeling bayesiano con RJAGS
Istruzioni dell'esercizio
- Ottieni le statistiche di
summary()per le catene diweight_sim_big. - La media a posteriori di \(b\) è riportata nella Tabella 1 di
summary(). Usa i dati grezzi inweight_chainsper verificare questo calcolo. - Costruisci uno scatter plot dei dati
wgtvshgtinbdims. Usageom_abline()per sovrapporre l’andamento medio a posteriori. - Costruisci un altro scatter plot di
wgtvshgt. Sovrapponi le 20 rette di regressione definite dai primi 20 insiemi di valori dei parametri \(a\) e \(b\) inweight_chains.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Summarize the posterior Markov chains
# Calculate the estimated posterior mean of b
mean(___)
# Plot the posterior mean regression model
ggplot(bdims, aes(x = ___, y = ___)) +
geom_point() +
geom_abline(intercept = mean(___), slope = mean(___), color = "red")
# Visualize the range of 20 posterior regression models
ggplot(bdims, aes(x = ___, y = ___)) +
geom_point() +
geom_abline(intercept = ___[1:20], slope = ___[1:20], color = "gray", size = 0.25)