Teste de hipótese - Diferença de médias

Queremos testar a hipótese de que existe uma diferença nas doações médias recebidas de A e B. Antes, você aprendeu a gerar uma permutação dos dados. Agora, vamos gerar uma distribuição nula da diferença de médias e, em seguida, calcular o p-valor.

Para a distribuição nula, primeiro geramos vários conjuntos de dados permutados e armazenamos a diferença de médias em cada caso. Depois, calculamos a estatística de teste como a diferença de médias com o conjunto de dados original. Por fim, aproximamos o p-valor calculando o dobro da fração de casos em que a diferença é maior ou igual ao valor absoluto da estatística de teste (hipótese bicaudal). Um p-valor menor do que, por exemplo, 0,05 pode indicar significância estatística.

Este exercício faz parte do curso

Simulação Estatística em Python

Instruções do exercício

Gere múltiplas permutações de donations_A e donations_B e atribua a perm.
Defina samples como a diferença das médias de permuted_A_datasets e permuted_B_datasets. Definimos axis=1 para obter uma média para cada conjunto de dados em vez de uma média geral.
Defina test_stat como a diferença das médias de donations_A e donations_B.
Calcule o p-valor p_val como o dobro da fração de samples maior ou igual ao valor absoluto de test_stat.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Generate permutations equal to the number of repetitions
perm = np.array([np.random.____(len(____) + len(____)) for i in range(reps)])
permuted_A_datasets = data[perm[:, :len(donations_A)]]
permuted_B_datasets = data[perm[:, len(donations_A):]]

# Calculate the difference in means for each of the datasets
samples = np.mean(____, axis=1) - np.mean(____, axis=1)

# Calculate the test statistic and p-value
test_stat = ____
p_val = 2*np.sum(____ >= np.abs(____))/reps
print("p-value = {}".format(p_val))

Editar e executar o código

Este exercício faz parte do curso

Simulação Estatística em Python

IntermediárioNível de habilidade

4.9+

Iniciar curso de graça

Este capítulo oferece as ferramentas necessárias para executar uma simulação. Vamos começar revisando variáveis aleatórias e distribuições de probabilidade. Em seguida, você vai aprender a executar uma simulação, primeiro entendendo um fluxo de trabalho de simulação e depois recriando-o no contexto de um jogo de dados. Por fim, vamos ver como usar simulações para tomar decisões.

Exercise 1: Introdução às variáveis aleatórias Exercise 2: np.random.choice()Exercise 3: Variável aleatória de Poisson Exercise 4: Embaralhando um baralho Exercise 5: Noções básicas de simulação Exercise 6: Lançando um dado justo Exercise 7: Lançando dois dados justos Exercise 8: Simulando o jogo de dados Exercise 9: Usando simulação para tomada de decisão Exercise 10: Simulando um sorteio de loteria Exercise 11: Devemos comprar?Exercise 12: Calculando o preço de equilíbrio de uma loteria

Este capítulo traz uma introdução básica a conceitos de probabilidade e uma compreensão prática do processo de geração de dados. Vamos explorar vários exemplos de modelagem do processo de geração de dados e concluir com a modelagem de uma simulação de anúncios em eCommerce.

Exercise 1: Noções básicas de probabilidade Exercise 2: Dama e espadas Exercise 3: Um par Exercise 4: Jogo dos treze Exercise 5: Mais conceitos de probabilidade Exercise 6: A urna condicional Exercise 7: Problema do aniversário Exercise 8: Full house Exercise 9: Processo de geração de dados Exercise 10: Teste de direção Exercise 11: Eleições nacionais Exercise 12: Metas de fitness Exercise 13: Simulação de anúncio em eCommerce Exercise 14: Fluxo de cadastro Exercise 15: Fluxo de Compra Exercise 16: Probabilidade de perder dinheiro

Neste capítulo, você terá uma breve introdução aos métodos de reamostragem e suas aplicações. Vamos experimentar o bootstrap, o jackknife e o teste de permutação. Ao concluir este capítulo, você estará pronto para começar a aplicar métodos simples de reamostragem na análise de dados.

Exercise 1: Introdução aos métodos de reamostragem Exercise 2: Amostragem com reposição Exercise 3: Exemplo de probabilidade Exercise 4: Bootstrapping Exercise 5: Executando um bootstrap simples Exercise 6: Estimadores não padronizados Exercise 7: Bootstrap em regressão Exercise 8: Reamostragem jackknife Exercise 9: Estimativa jackknife básica - média Exercise 10: Intervalo de confiança jackknife para a mediana Exercise 11: Testes de permutação Exercise 12: Gerando uma única permutação Exercise 13: Teste de hipótese - Diferença de médias

Exercício atual

Exercise 14: Teste de hipótese - Estatísticas não padronizadas

Neste capítulo, você será apresentado a aplicações básicas e avançadas de simulação para resolver problemas do mundo real. Vamos trabalhar um problema de planejamento de negócios, aprender sobre Integração de Monte Carlo, Análise de Poder com simulação e concluir com uma simulação de portfólio financeiro. Ao concluir este capítulo, você estará pronto para aplicar simulação na solução de problemas do dia a dia.

Exercise 1: Simulação para Planejamento de Negócios Exercise 2: Modelando a produção de milho Exercise 3: Modelando lucros Exercise 4: Otimizando custos Exercise 5: Integração de Monte Carlo Exercise 6: Integração de uma Função Simples Exercise 7: Calculando o valor de pi Exercise 8: Simulação para Análise de Poder Exercise 9: Fatores que influenciam o poder estatístico Exercise 10: Análise de Poder - Parte I Exercise 11: Análise de Poder - Parte II Exercise 12: Aplicações em Finanças Exercise 13: Simulação de Portfólio - Parte I Exercise 14: Simulação de Portfólio - Parte II Exercise 15: Simulação de Portfólio - Parte III Exercise 16: Encerramento