Estimaciones puntuales posteriores
Recuerda la verosimilitud del modelo de regresión bayesiana del peso \(Y\) por la altura \(X\): \(Y \sim N(m, s^2)\) donde \(m = a + b X\). Tienes en tu espacio de trabajo una simulación RJAGS del posterior con 100.000 iteraciones, weight_sim_big, junto con un data frame con la salida de la cadena de Markov:
> head(weight_chains, 2)
a b s iter
1 -113.9029 1.072505 8.772007 1
2 -115.0644 1.077914 8.986393 2
Las medias posteriores de los parámetros de intercepto y pendiente, \(a\) y \(b\), reflejan la tendencia media posterior en la relación entre peso y altura. En cambio, los posteriores completos de \(a\) y \(b\) reflejan el rango de parámetros plausibles y, por tanto, la incertidumbre posterior en la tendencia. A continuación examinarás la tendencia y su incertidumbre. Los datos bdims están en tu espacio de trabajo.
Este ejercicio forma parte del curso
Modelado bayesiano con RJAGS
Instrucciones del ejercicio
- Obtén las estadísticas de
summary()de las cadenas deweight_sim_big. - La media posterior de \(b\) aparece en la Tabla 1 del
summary(). Utiliza los datos sin procesar deweight_chainspara verificar este cálculo. - Construye un diagrama de dispersión de
wgtfrente ahgtenbdims. Usageom_abline()para superponer la tendencia media posterior. - Construye otro diagrama de dispersión de
wgtfrente ahgt. Superpone las 20 rectas de regresión definidas por los primeros 20 conjuntos de valores de los parámetros \(a\) y \(b\) enweight_chains.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Summarize the posterior Markov chains
# Calculate the estimated posterior mean of b
mean(___)
# Plot the posterior mean regression model
ggplot(bdims, aes(x = ___, y = ___)) +
geom_point() +
geom_abline(intercept = mean(___), slope = mean(___), color = "red")
# Visualize the range of 20 posterior regression models
ggplot(bdims, aes(x = ___, y = ___)) +
geom_point() +
geom_abline(intercept = ___[1:20], slope = ___[1:20], color = "gray", size = 0.25)