Gerando uma única permutação
Nos próximos exercícios, vamos executar um teste de significância usando testes de permutação. Como discutido no vídeo, queremos ver se há alguma diferença nas doações geradas pelos dois designs — A e B. Suponha que você executou as duas versões por alguns dias e obteve 500 doações no A e 700 no B, armazenadas nas variáveis donations_A e donations_B.
Primeiro, precisamos gerar uma distribuição nula para a diferença entre as médias. Vamos fazer isso gerando várias permutações do conjunto de dados e calculando a diferença entre as médias em cada caso.
Para começar, gere uma permutação e calcule a diferença entre as médias para o conjunto de dados permutado.
Este exercício faz parte do curso
Simulação Estatística em Python
Instruções do exercício
- Concatene os dois arrays
donations_Aedonations_Busandonp.concatenate()e atribua adata. - Obtenha uma única permutação usando
np.random.permutation()e atribua aperm. - Calcule a diferença entre os valores médios de
permuted_Aepermuted_Bcomodiff_in_means.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Concatenate the two arrays donations_A and donations_B into data
len_A, len_B = len(donations_A), len(donations_B)
data = ____([donations_A, donations_B])
# Get a single permutation of the concatenated length
perm = ____(len(donations_A) + len(donations_B))
# Calculate the permutated datasets and difference in means
permuted_A = data[perm[:len(donations_A)]]
permuted_B = data[perm[len(donations_A):]]
diff_in_means = ____
print("Difference in the permuted mean values = {}.".format(diff_in_means))