ComenzarEmpieza gratis

Resumiendo el coste de oportunidad (2)

Ahora que has creado la distribución de aleatorización, la usarás para evaluar si la diferencia observada de proporciones es coherente con la diferencia nula. Medirás esta coherencia (o su ausencia) con un valor p, es decir, la proporción de diferencias permutadas menores o iguales que la diferencia observada.

El conjunto de datos permutado y la estadística observada original están disponibles en tu espacio de trabajo como opp_perm y diff_orig, respectivamente.

Utiliza visualize y get_p_value con las funciones integradas de infer. Recuerda que las estadísticas nulas están por encima de la diferencia original, así que el valor p (que representa cuántas veces un valor nulo es más extremo) se calcula contando el número de valores nulos que son less que la diferencia original.

Este ejercicio forma parte del curso

Fundamentos de la inferencia en R

Ver curso

Instrucciones del ejercicio

  • Primero, visualize la distribución de muestreo de las estadísticas permutadas indicando el lugar donde obs_stat = diff_orig y coloreando los valores por debajo con el argumento direction = "less".
  • Luego, get_p_value se calcula como la proporción de estadísticas permutadas que están direction = "less" que obs_stat = diff_orig.
  • Como alternativa para calcular el valor p, usa summarize() y mean() para obtener la proporción de veces que las diferencias permutadas en opp_perm (llamadas stat) son menores o iguales que la diferencia observada (llamada diff_orig).
  • Puedes poner a prueba lo que sabes probando: direction = "greater", direction = "two_sided" y direction = "less" antes de Enviar respuesta en ambos, visualize y get_p_value.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Visualize the statistic 
opp_perm %>%
  ___(___, ___)

# Calculate the p-value using `get_p_value`
opp_perm %>%
  ___(___, ___)

# Calculate the p-value using `summarize`
opp_perm %>%
  summarize(p_value = ___)
Editar y ejecutar código