Distribución muestral nula de la pendiente
En el capítulo anterior, investigaste la distribución muestral de la pendiente a partir de una población donde la pendiente no era cero. Sin embargo, para hacer inferencia, normalmente necesitarás conocer la distribución muestral de la pendiente bajo la hipótesis de que no hay relación entre las variables explicativa y de respuesta. Además, en la mayoría de situaciones no conoces la población de la que provienen los datos, así que la distribución nula debe derivarse únicamente del conjunto de datos original.
A mediados del siglo XX se realizó un estudio que localizó gemelos idénticos separados al nacer: uno de los niños fue criado por sus padres biológicos y el otro en una familia de acogida. Para intentar responder a la pregunta de si la inteligencia es fruto de la genética o del entorno, a ambos se les administraron tests de CI. Los datos resultantes incluyen los CI de los gemelos en acogida (Foster, variable de respuesta) y los CI de los gemelos biológicos (Biological, variable explicativa).
En este ejercicio usarás la función pull(). Esta función toma un data frame y devuelve una columna seleccionada como vector (similar a $).
Este ejercicio forma parte del curso
Inferencia para la regresión lineal en R
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
library(infer)
# Calculate the observed slope
# Run a lin. reg. of Foster vs. Biological on the twins data
obs_slope <- ___(___, ___) %>%
# Tidy the result
___() %>%
# Filter for rows where term equal Biological
___(___) %>%
# Pull out the estimate column
___(___)
# See the result
obs_slope