Inferencia con y sin valor atípico (aleatorización)
Con la prueba de aleatorización puedes volver a evaluar el efecto de un valor atípico en las conclusiones inferenciales de un modelo lineal. Ejecuta una prueba de aleatorización sobre los datos hypdata_out dos veces: una con el valor atípico y otra sin él. Ten en cuenta que las líneas de código extendidas comunican claramente los pasos de las pruebas de aleatorización.
Este ejercicio forma parte del curso
Inferencia para la regresión lineal en R
Instrucciones del ejercicio
Usando los data frames hypdata_out (que contiene un valor atípico) y hypdata_noout (valor atípico eliminado), se crearon los data frames perm_slope_out y perm_slope_noout para contener las pendientes permutadas de los conjuntos de datos originales, respectivamente. Los valores observados se guardan en las variables obs_slope_out y obs_slope_noout.
- Obtén los valores p calculando la proporción de pendientes permutadas (en valor
absoluto) que son mayores o iguales que las pendientes observadas (también en valorabsoluto). Como antes, usameansobre la desigualdad binaria para calcular la proporción.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Calculate the p-value with the outlier
perm_slope_out %>%
mutate(abs_perm_slope = ___) %>%
summarize(p_value = ___)
# Calculate the p-value without the outlier
perm_slope_noout %>%
mutate(abs_perm_slope = ___) %>%
summarize(p_value = ___)