Distribución muestral nula de la pendiente

En el capítulo anterior, investigaste la distribución muestral de la pendiente a partir de una población donde la pendiente no era cero. Sin embargo, para hacer inferencia, normalmente necesitarás conocer la distribución muestral de la pendiente bajo la hipótesis de que no hay relación entre las variables explicativa y de respuesta. Además, en la mayoría de situaciones no conoces la población de la que provienen los datos, así que la distribución nula debe derivarse únicamente del conjunto de datos original.

A mediados del siglo XX se realizó un estudio que localizó gemelos idénticos separados al nacer: uno de los niños fue criado por sus padres biológicos y el otro en una familia de acogida. Para intentar responder a la pregunta de si la inteligencia es fruto de la genética o del entorno, a ambos se les administraron tests de CI. Los datos resultantes incluyen los CI de los gemelos en acogida (Foster, variable de respuesta) y los CI de los gemelos biológicos (Biological, variable explicativa).

En este ejercicio usarás la función pull(). Esta función toma un data frame y devuelve una columna seleccionada como vector (similar a $).

Este ejercicio forma parte del curso

Inferencia para la regresión lineal en R

Ver curso

ejercicio interactivo práctico

Prueba este ejercicio completando este código de ejemplo.

library(infer)

# Calculate the observed slope
# Run a lin. reg. of Foster vs. Biological on the twins data
obs_slope <- ___(___, ___) %>%
  # Tidy the result
  ___() %>%   
  # Filter for rows where term equal Biological
  ___(___) %>%
  # Pull out the estimate column
  ___(___) 

# See the result
obs_slope

Editar y ejecutar código