A média das médias

Você deseja saber qual é o número médio de usuários (num_users) por negócio, mas deseja saber esse número para toda a empresa para que possa ver se os negócios de Amir têm mais ou menos usuários do que a média de negócios da empresa. O problema é que, no último ano, a empresa trabalhou em mais de dez mil negócios, portanto, não é realista compilar todos os dados. Em vez disso, você estimará a média coletando várias amostras aleatórias de negócios, pois isso é muito mais fácil do que coletar dados de todos na empresa.

amir_deals está disponível e os dados do usuário para todas as ofertas da empresa estão disponíveis em all_deals. pandas como pd e numpy como np estão carregados.

Este exercicio faz parte do curso

Introdução à estatística em Python

Instruções do exercicio

Defina a semente aleatória como 321.
Pegue 30 amostras (com reposição) de tamanho 20 de all_deals['num_users'] e tire a média de cada amostra. Armazene as médias das amostras em sample_means.
Imprima a média de sample_means.
Imprima a mediana da coluna num_users de amir_deals.

exercicio interativo prático

Tente este exercicio completando este código de exemplo.

# Set seed to 321
____

sample_means = []
# Loop 30 times to take 30 means
for i in range(____):
  # Take sample of size 20 from num_users col of all_deals with replacement
  cur_sample = ____
  # Take mean of cur_sample
  cur_mean = ____
  # Append cur_mean to sample_means
  sample_means.append(____)

# Print mean of sample_means
print(____)

# Print mean of num_users in amir_deals
print(____)

Editar e Executar Código

Este exercicio faz parte do curso

Introdução à estatística em Python

IntermediárioNível de habilidade

4.8+

Comece o curso gratuitamente

As estatísticas resumidas fornecem as ferramentas necessárias para resumir conjuntos de dados enormes e revelar os destaques. Neste capítulo, você explorará as estatísticas resumidas, incluindo média, mediana e desvio-padrão, e aprenderá a interpretá-las com precisão. Você também desenvolverá suas habilidades de pensamento crítico, o que lhe permitirá escolher as melhores estatísticas resumidas para seus dados.

Exercise 1: O que é estatística?Exercise 2: Estatística descritiva e inferencial Exercise 3: Classificação do tipo de dados Exercise 4: Medidas de centro Exercise 5: Calculando a média e a mediana Exercise 6: Média, mediana e formato da distribuição Exercise 7: Medidas de propagação Exercise 8: Variância e desvio-padrão Exercise 9: Quartis, quantis e quintis Exercise 10: Identificação de valores discrepantes usando IQR

Neste capítulo, você aprenderá a gerar amostras aleatórias e a medir a chance usando a probabilidade. Você trabalhará com dados de vendas do mundo real para calcular a probabilidade de um vendedor ser bem-sucedido. Por fim, você usará a distribuição binomial para modelar eventos com resultados binários.

Exercise 1: Quais são as chances?Exercise 2: Com ou sem reposição?Exercise 3: Cálculo de probabilidades Exercise 4: Amostragem de negócios Exercise 5: Distribuições discretas Exercise 6: Criação de uma distribuição de probabilidade Exercise 7: Identificação de distribuições Exercise 8: Valor esperado vs. média da amostra Exercise 9: Distribuições contínuas Exercise 10: Qual distribuição?Exercise 11: Backups de dados Exercise 12: Simulação de tempos de espera Exercise 13: A distribuição binomial Exercise 14: Simulação de negócios de vendas Exercise 15: Cálculo de probabilidades binomiais Exercise 16: Quantas vendas serão realizadas?

Chegou a hora de explorar uma das mais importantes distribuições de probabilidade em estatística, a distribuição normal. Você criará histogramas para traçar distribuições normais e compreenderá o teorema central do limite, antes de expandir seu conhecimento de funções estatísticas adicionando as distribuições Poisson, exponencial e t ao seu repertório.

Exercise 1: A distribuição normal Exercise 2: Distribuição das vendas de Amir Exercise 3: Probabilidades da distribuição normal Exercise 4: Simulação de vendas sob novas condições de mercado Exercise 5: Qual mercado é melhor?Exercise 6: O teorema central do limite Exercise 7: Visualização de distribuições de amostragens Exercise 8: O TCL em ação Exercise 9: A média das médias

Exercicio Atual

Exercise 10: A distribuição de Poisson Exercise 11: Identificando o lambda Exercise 12: Rastreamento de respostas de leads Exercise 13: Mais distribuições de probabilidade Exercise 14: Arrastar e soltar distribuições Exercise 15: Modelagem do tempo entre leads Exercise 16: A distribuição t

Neste capítulo, você aprenderá a quantificar a força de uma relação linear entre duas variáveis e a explorar como as variáveis de confusão podem afetar a relação entre duas outras variáveis. Você também verá como o desenho de um estudo pode influenciar seus resultados, alterar a forma como os dados devem ser analisados e, possivelmente, afetar a confiabilidade de suas conclusões.

Exercise 1: Correlação Exercise 2: Adivinhe a correlação Exercise 3: Relações entre variáveis Exercise 4: Advertências sobre a correlação Exercise 5: O que a correlação não pode medir?Exercise 6: Transformando variáveis Exercise 7: O açúcar aumenta a felicidade?Exercise 8: Fatores de confusão Exercise 9: Projeto de experimentos Exercise 10: Tipos de estudo Exercise 11: Estudos longitudinais vs. estudos transversais Exercise 12: Parabéns!