Estatística de teste para média de duas amostras
O teste de hipóteses para determinar se existe diferença entre as médias de duas populações usa um tipo diferente de estatística de teste em relação aos escores z que você viu no Capítulo 1. Ela é chamada de "t" e pode ser calculada a partir de três valores de cada amostra usando esta equação.
$$ t = \dfrac{(\bar{x}_{\text{child}} - \bar{x}_{\text{adult}})}{\sqrt{\dfrac{s_{\text{child}}^2}{n_{\text{child}}} + \dfrac{s_{\text{adult}}^2}{n_{\text{adult}}}}} $$
Ao tentar determinar por que algumas remessas estão atrasadas, você pode se perguntar se o peso das remessas que estavam no prazo é menor do que o peso das remessas que estavam atrasadas. O conjunto de dados late_shipments
foi dividido em um grupo "sim", no qual late == "Yes"
, e um grupo "não", no qual late == "No"
. O peso da remessa consta na variável weight_kilograms
.
As médias das amostras dos dois grupos estão disponíveis em xbar_no
e xbar_yes
. Os desvios-padrão da amostra são s_no
e s_yes
. Os tamanhos de amostra são n_no
e n_yes
. numpy
também foi carregado como np
.
Este exercício faz parte do curso
Teste de hipóteses em Python
Instruções de exercício
- Calcule o numerador da estatística do teste \(t\).
- Calcule o denominador da estatística do teste \(t\).
- Use esses dois números para calcular a estatística do teste \(t\).
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Calculate the numerator of the test statistic
numerator = ____
# Calculate the denominator of the test statistic
denominator = ____
# Calculate the test statistic
t_stat = ____
# Print the test statistic
print(t_stat)