Designação não aleatória de sujeitos
Uma empresa agrícola está realizando um experimento para medir como a alimentação de ovelhas com diferentes tipos de grama afeta seu peso. Eles pediram a ajuda de vocês para preparar adequadamente o experimento. Um de seus gerentes disse que você pode realizar a atribuição de assunto pegando as 250 primeiras linhas do DataFrame e que isso deve ser suficiente.
Sua tarefa é usar suas habilidades analíticas para demonstrar por que isso pode não ser uma boa ideia. Atribua os sujeitos a dois grupos usando atribuição não aleatória (as primeiras 250 linhas) e observe as diferenças nas estatísticas descritivas.
Você recebeu o DataFrame, weights
, que tem uma coluna contendo o weight
da ovelha e uma coluna exclusiva id
.
numpy
e pandas
foram importados como np
e pd
, respectivamente.
Este exercício faz parte do curso
Projeto experimental em Python
Instruções de exercício
- Use o corte de DataFrame para colocar as primeiras 250 linhas de
weights
emgroup1_non_rand
e as restantes emgroup2_non_rand
. - Gerar estatísticas descritivas dos dois grupos e concatená-las em um único DataFrame.
- Imprima para observar as diferenças.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Non-random assignment
group1_non_rand = ____
group2_non_rand = ____
# Compare descriptive statistics of groups
compare_df_non_rand = ____([group1_non_rand['weight'].____, group2_non_rand['weight'].____], axis=1)
compare_df_non_rand.columns = ['group1', 'group2']
# Print to assess
print(____)