Resumiendo el coste de oportunidad (2)
Ahora que has creado la distribución de aleatorización, la usarás para evaluar si la diferencia observada de proporciones es coherente con la diferencia nula. Medirás esta coherencia (o su ausencia) con un valor p, es decir, la proporción de diferencias permutadas menores o iguales que la diferencia observada.
El conjunto de datos permutado y la estadística observada original están disponibles en tu espacio de trabajo como opp_perm y diff_orig, respectivamente.
Utiliza visualize y get_p_value con las funciones integradas de infer. Recuerda que las estadísticas nulas están por encima de la diferencia original, así que el valor p (que representa cuántas veces un valor nulo es más extremo) se calcula contando el número de valores nulos que son less que la diferencia original.
Este ejercicio forma parte del curso
Fundamentos de la inferencia en R
Instrucciones del ejercicio
- Primero,
visualizela distribución de muestreo de las estadísticas permutadas indicando el lugar dondeobs_stat = diff_origy coloreando los valores por debajo con el argumentodirection = "less". - Luego,
get_p_valuese calcula como la proporción de estadísticas permutadas que estándirection = "less"queobs_stat = diff_orig. - Como alternativa para calcular el valor p, usa
summarize()ymean()para obtener la proporción de veces que las diferencias permutadas enopp_perm(llamadasstat) son menores o iguales que la diferencia observada (llamadadiff_orig). - Puedes poner a prueba lo que sabes probando:
direction = "greater",direction = "two_sided"ydirection = "less"antes de Enviar respuesta en ambos,visualizeyget_p_value.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Visualize the statistic
opp_perm %>%
___(___, ___)
# Calculate the p-value using `get_p_value`
opp_perm %>%
___(___, ___)
# Calculate the p-value using `summarize`
opp_perm %>%
summarize(p_value = ___)