A média das médias
Você deseja saber qual é o número médio de usuários (num_users) por negócio, mas deseja saber esse número para toda a empresa para que possa ver se os negócios de Amir têm mais ou menos usuários do que a média de negócios da empresa. O problema é que, no último ano, a empresa trabalhou em mais de dez mil negócios, portanto, não é realista compilar todos os dados. Em vez disso, você estimará a média coletando várias amostras aleatórias de negócios, pois isso é muito mais fácil do que coletar dados de todos na empresa.
amir_deals está disponível e os dados do usuário para todas as ofertas da empresa estão disponíveis em all_deals. pandas como pd e numpy como np estão carregados.
Este exercício faz parte do curso
Introdução à estatística em Python
Instruções do exercício
- Defina a semente aleatória como
321. - Pegue 30 amostras (com reposição) de tamanho 20 de
all_deals['num_users']e tire a média de cada amostra. Armazene as médias das amostras emsample_means. - Imprima a média de
sample_means. - Imprima a mediana da coluna
num_usersdeamir_deals.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Set seed to 321
____
sample_means = []
# Loop 30 times to take 30 means
for i in range(____):
# Take sample of size 20 from num_users col of all_deals with replacement
cur_sample = ____
# Take mean of cur_sample
cur_mean = ____
# Append cur_mean to sample_means
sample_means.append(____)
# Print mean of sample_means
print(____)
# Print mean of num_users in amir_deals
print(____)