Gerando uma amostra por permutação
No vídeo, você viu que a amostragem por permutação é uma ótima forma de simular a hipótese de que duas variáveis têm distribuições de probabilidade idênticas. Essa é uma hipótese que você geralmente quer testar, então, neste exercício, você vai escrever uma função para gerar uma amostra por permutação a partir de dois conjuntos de dados.
Lembre-se: uma amostra por permutação de dois arrays com n1 e n2 elementos, respectivamente, é construída concatenando os arrays, embaralhando o conteúdo do array concatenado e, em seguida, pegando os primeiros n1 elementos como a amostra por permutação do primeiro array e os últimos n2 elementos como a amostra por permutação do segundo array.
Este exercício faz parte do curso
Pensamento Estatístico em Python (Parte 2)
Instruções do exercício
- Concatene os dois arrays de entrada em um único array usando
np.concatenate(). Certifique-se de passardata1edata2como um único argumento(data1, data2). - Use
np.random.permutation()para permutar o array concatenado. - Armazene as primeiras
len(data1)entradas depermuted_datacomoperm_sample_1e as últimaslen(data2)entradas depermuted_datacomoperm_sample_2. Na prática, isso pode ser feito usando:len(data1)elen(data1):para fatiarpermuted_data. - Retorne
perm_sample_1eperm_sample_2.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
def permutation_sample(data1, data2):
"""Generate a permutation sample from two data sets."""
# Concatenate the data sets: data
data = ____
# Permute the concatenated array: permuted_data
permuted_data = ____
# Split the permuted array into two: perm_sample_1, perm_sample_2
perm_sample_1 = permuted_data[____]
perm_sample_2 = permuted_data[____]
return perm_sample_1, perm_sample_2