Posterior puntschattingen
Herinner je de likelihood van het Bayesiaanse regressiemodel van gewicht \(Y\) op lengte \(X\): \(Y \sim N(m, s^2)\) waarbij \(m = a + b X\). Een RJAGS-simulatie van 100.000 iteraties van de posterior, weight_sim_big, staat in je werkruimte, samen met een data frame met de Markovketen-output:
> head(weight_chains, 2)
a b s iter
1 -113.9029 1.072505 8.772007 1
2 -115.0644 1.077914 8.986393 2
De posterior-gemiddelden van de intercept- en hellingsparameters, \(a\) en \(b\), geven de posterior-gemiddelde trend in de relatie tussen gewicht en lengte weer. Daarentegen geven de volledige posteriors van \(a\) en \(b\) het bereik van plausibele parameters weer, en dus de posterior-onzekerheid in de trend. Hieronder bekijk je de trend en de onzekerheid in deze trend. De bdims-gegevens staan in je werkruimte.
Deze oefening maakt deel uit van de cursus
Bayesiaans modelleren met RJAGS
Oefeninstructies
- Vraag
summary()-statistieken op van deweight_sim_big-ketens. - Het posterior-gemiddelde van \(b\) staat in Tabel 1 van de
summary(). Gebruik de ruweweight_chainsom deze berekening te verifiëren. - Maak een spreidingsdiagram van
wgtversushgtuitbdims. Gebruikgeom_abline()om de posterior-gemiddelde trend te overlappen. - Maak nog een spreidingsdiagram van
wgtversushgt. Overlap de 20 regressielijnen die worden gedefinieerd door de eerste 20 sets van \(a\)- en \(b\)-parameterwaarden inweight_chains.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Summarize the posterior Markov chains
# Calculate the estimated posterior mean of b
mean(___)
# Plot the posterior mean regression model
ggplot(bdims, aes(x = ___, y = ___)) +
geom_point() +
geom_abline(intercept = mean(___), slope = mean(___), color = "red")
# Visualize the range of 20 posterior regression models
ggplot(bdims, aes(x = ___, y = ___)) +
geom_point() +
geom_abline(intercept = ___[1:20], slope = ___[1:20], color = "gray", size = 0.25)