ComeçarComece gratuitamente

A média das médias

Você deseja saber qual é o número médio de usuários (num_users) por negócio, mas deseja saber esse número para toda a empresa para que possa ver se os negócios de Amir têm mais ou menos usuários do que a média de negócios da empresa. O problema é que, no último ano, a empresa trabalhou em mais de dez mil negócios, portanto, não é realista compilar todos os dados. Em vez disso, você estimará a média coletando várias amostras aleatórias de negócios, pois isso é muito mais fácil do que coletar dados de todos na empresa.

amir_deals está disponível e os dados do usuário para todas as ofertas da empresa estão disponíveis em all_deals. Tanto pandas como pd e numpy como np estão carregados.

Este exercício faz parte do curso

Introdução à estatística em Python

Ver Curso

Instruções de exercício

  • Defina a semente aleatória como 321.
  • Pegue 30 amostras (com reposição) de tamanho 20 de all_deals['num_users'] e tire a média de cada amostra. Armazene as médias das amostras em sample_means.
  • Imprima a média de sample_means.
  • Imprima a mediana da coluna num_users de amir_deals.

Exercício interativo prático

Experimente este exercício preenchendo este código de exemplo.

# Set seed to 321
____

sample_means = []
# Loop 30 times to take 30 means
for i in range(____):
  # Take sample of size 20 from num_users col of all_deals with replacement
  cur_sample = ____
  # Take mean of cur_sample
  cur_mean = ____
  # Append cur_mean to sample_means
  sample_means.append(____)

# Print mean of sample_means
print(____)

# Print mean of num_users in amir_deals
print(____)
Editar e executar código