Calcular los p-values
En el vídeo, viste que un p-value mide el grado de desacuerdo entre los datos y la hipótesis nula. Aquí vas a calcular el p-value para el conjunto de datos original sobre discriminación y también para las versiones pequeña y grande, disc_small y disc_big.
Las diferencias originales en proporciones están disponibles en tu espacio de trabajo: diff_orig, diff_orig_small y diff_orig_big, al igual que los conjuntos permutados: disc_perm, disc_perm_small y disc_perm_big.
Recuerda que aquí solo nos interesa una prueba de hipótesis unilateral. Es decir, intentas responder a la pregunta: «¿Es más probable que los hombres sean promocionados que las mujeres?»
Este ejercicio forma parte del curso
Fundamentos de la inferencia en R
Instrucciones del ejercicio
- Usa
visualize()yget_p_value()con las funciones integradas deinfer. Recuerda que las estadísticas nulas están por debajo de la diferencia original, así que el p-value (que representa con qué frecuencia un valor nulo es más extremo) se calcula contando cuántos valores nulos songreaterque la diferencia original. - Repite con el conjunto pequeño,
disc_perm_small, que tiene la diferencia observadadiff_orig_small. - Repite con el conjunto grande,
disc_perm_big, que tiene la diferencia observadadiff_orig_big. - Puedes poner a prueba lo que sabes probando:
direction = "greater",direction = "two_sided"ydirection = "less"antes de Enviar respuesta.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Visualize and calculate the p-value for the original dataset
disc_perm %>%
___(obs_stat = ___, direction = "___")
disc_perm %>%
___(___, ___)
# Visualize and calculate the p-value for the small dataset
___ %>%
___(___, ___)
___ %>%
___(___, ___)
# Visualize and calculate the p-value for the big dataset
___ %>%
___(___, ___)
___ %>%
___(___, ___)