Generar una única permutación
En los próximos ejercicios, vamos a realizar una prueba de significación mediante test de permutación. Como se comentó en el vídeo, queremos comprobar si hay alguna diferencia en las donaciones generadas por los dos diseños: A y B. Supón que has estado ejecutando ambas versiones durante unos días y has obtenido 500 donaciones en A y 700 en B, guardadas en las variables donations_A y donations_B.
Primero necesitamos generar una distribución nula para la diferencia de medias. Lo haremos generando múltiples permutaciones del conjunto de datos y calculando la diferencia de medias en cada caso.
Para empezar, generemos una permutación y calculemos la diferencia de medias para el conjunto de datos permutado.
Este ejercicio forma parte del curso
Simulación estadística en Python
Instrucciones del ejercicio
- Concatena los dos arrays
donations_Aydonations_Busandonp.concatenate()y asígnalo adata. - Obtén una única permutación usando
np.random.permutation()y asígnala aperm. - Calcula la diferencia entre los valores medios de
permuted_Aypermuted_Bcomodiff_in_means.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Concatenate the two arrays donations_A and donations_B into data
len_A, len_B = len(donations_A), len(donations_B)
data = ____([donations_A, donations_B])
# Get a single permutation of the concatenated length
perm = ____(len(donations_A) + len(donations_B))
# Calculate the permutated datasets and difference in means
permuted_A = data[perm[:len(donations_A)]]
permuted_B = data[perm[len(donations_A):]]
diff_in_means = ____
print("Difference in the permuted mean values = {}.".format(diff_in_means))