Hypothèse nulle
Dans cet exercice, nous formulons l’hypothèse nulle comme suit :
les durées courtes et longues n’ont aucun effet sur la distance totale parcourue.
Nous interprétons la « taille d’effet nulle » comme signifiant que si nous mélangions des échantillons entre les durées courtes et longues, de sorte que deux nouveaux échantillons contiennent chacun un mélange de trajets de courte et de longue durée, puis que nous calculions la statistique de test, sa valeur moyenne serait nulle.
Votre objectif ici est d’effectuer le mélange et le rééchantillonnage. Commencez avec group_duration_short et group_duration_long, qui sont les groupes de durées non mélangés.
Cet exercice fait partie du cours
Introduction à la modélisation linéaire en Python
Instructions
- Utilisez
np.concatenate()pour combiner les deux populations, puis utiliseznp.random.shuffle()pour mélanger les valeurs à l’intérieur de ce conteneur. - Découpez
shuffle_bucketen deux et utiliseznp.random.choice()pour rééchantillonner chaqueshuffle_half. - Calculez la
test_statisticen soustrayantresample_half1deresample_half2. - Calculez la
effect_sizeavecnp.mean()detest_statistic, et affichez le résultat.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Shuffle the time-ordered distances, then slice the result into two populations.
shuffle_bucket = np.____((group_duration_short, group_duration_long))
np.random.shuffle(____)
slice_index = len(shuffle_bucket)//2
shuffled_half1 = shuffle_bucket[0:____]
shuffled_half2 = shuffle_bucket[____:]
# Create new samples from each shuffled population, and compute the test statistic
resample_half1 = np.random.choice(____, size=500, replace=____)
resample_half2 = np.random.choice(____, size=500, replace=____)
test_statistic = ____ - ____
# Compute and print the effect size
effect_size = np.mean(____)
print('Test Statistic, after shuffling, mean = {}'.format(____))