Inferencia con y sin valor atípico (aleatorización)

Con la prueba de aleatorización puedes volver a evaluar el efecto de un valor atípico en las conclusiones inferenciales de un modelo lineal. Ejecuta una prueba de aleatorización sobre los datos hypdata_out dos veces: una con el valor atípico y otra sin él. Ten en cuenta que las líneas de código extendidas comunican claramente los pasos de las pruebas de aleatorización.

Este ejercicio forma parte del curso

Inferencia para la regresión lineal en R

Ver curso

Instrucciones del ejercicio

Usando los data frames hypdata_out (que contiene un valor atípico) y hypdata_noout (valor atípico eliminado), se crearon los data frames perm_slope_out y perm_slope_noout para contener las pendientes permutadas de los conjuntos de datos originales, respectivamente. Los valores observados se guardan en las variables obs_slope_out y obs_slope_noout.

Obtén los valores p calculando la proporción de pendientes permutadas (en valor absoluto) que son mayores o iguales que las pendientes observadas (también en valor absoluto). Como antes, usa mean sobre la desigualdad binaria para calcular la proporción.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Calculate the p-value with the outlier
perm_slope_out %>% 
  mutate(abs_perm_slope = ___) %>%
  summarize(p_value = ___)

# Calculate the p-value without the outlier
perm_slope_noout %>% 
  mutate(abs_perm_slope = ___) %>%
  summarize(p_value = ___)

Editar y ejecutar código