Prueba de hipótesis: ¿son más profundas las patas en 2012?
Tu gráfico de la ECDF y el cálculo del intervalo de confianza dejan bastante claro que las patas de G. scandens en Daphne Major se han hecho más profundas. Pero, ¿es posible que este efecto se deba solo al azar? Dicho de otra forma, ¿cuál es la probabilidad de obtener la diferencia observada en la media de la profundidad si las medias fueran iguales?
¡Ojo! La hipótesis que estamos poniendo a prueba no es que las profundidades provengan de la misma distribución. Para eso podríamos usar una prueba de permutación. La hipótesis es que las medias son iguales. Para realizar esta prueba de hipótesis, necesitamos desplazar los dos conjuntos de datos para que tengan la misma media y luego usar muestreo bootstrap para calcular la diferencia de medias.
Este ejercicio forma parte del curso
Pensamiento estadístico en Python (Parte 2)
Instrucciones del ejercicio
- Crea un array concatenado con las profundidades de 1975 y 2012 y calcula y guarda su media.
- Desplaza
bd_1975ybd_2012de forma que sus medias sean iguales a la que acabas de calcular para el conjunto de datos combinado. - Toma 10.000 réplicas bootstrap de la media para las profundidades de 1975 y otras 10.000 para las de 2012.
- Resta las réplicas de 1975 a las de 2012 para obtener réplicas bootstrap de la diferencia.
- Calcula e imprime el valor p. La diferencia observada de medias que calculaste en el ejercicio anterior sigue en tu espacio de nombres como
mean_diff.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Compute mean of combined data set: combined_mean
combined_mean = ____(____((bd_1975, bd_2012)))
# Shift the samples
bd_1975_shifted = ____
bd_2012_shifted = ____
# Get bootstrap replicates of shifted data sets
bs_replicates_1975 = ____
bs_replicates_2012 = ____
# Compute replicates of difference of means: bs_diff_replicates
bs_diff_replicates = ____
# Compute the p-value
p = np.sum(____ >= ____) / len(____)
# Print p-value
print('p =', p)