A média das médias
Você deseja saber qual é o número médio de usuários (num_users
) por negócio, mas deseja saber esse número para toda a empresa para que possa ver se os negócios de Amir têm mais ou menos usuários do que a média de negócios da empresa. O problema é que, no último ano, a empresa trabalhou em mais de dez mil negócios, portanto, não é realista compilar todos os dados. Em vez disso, você estimará a média coletando várias amostras aleatórias de negócios, pois isso é muito mais fácil do que coletar dados de todos na empresa.
amir_deals
está disponível e os dados do usuário para todas as ofertas da empresa estão disponíveis em all_deals
. Tanto pandas
como pd
e numpy
como np
estão carregados.
Este exercício faz parte do curso
Introdução à estatística em Python
Instruções de exercício
- Defina a semente aleatória como
321
. - Pegue 30 amostras (com reposição) de tamanho 20 de
all_deals['num_users']
e tire a média de cada amostra. Armazene as médias das amostras emsample_means
. - Imprima a média de
sample_means
. - Imprima a mediana da coluna
num_users
deamir_deals
.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Set seed to 321
____
sample_means = []
# Loop 30 times to take 30 means
for i in range(____):
# Take sample of size 20 from num_users col of all_deals with replacement
cur_sample = ____
# Take mean of cur_sample
cur_mean = ____
# Append cur_mean to sample_means
sample_means.append(____)
# Print mean of sample_means
print(____)
# Print mean of num_users in amir_deals
print(____)