Visualiser la valeur p
Dans cet exercice, vous allez visualiser la valeur p, c’est‑à‑dire la probabilité que l’effet (ou la « vitesse ») que nous avons estimé résulte de la variation aléatoire de l’échantillon. Votre objectif est de la représenter comme la fraction de points de la distribution de la statistique de test après mélange qui se trouvent à droite de la moyenne de la statistique de test (la « taille d’effet ») calculée à partir des échantillons non mélangés.
Pour vous aider à démarrer, nous avons préchargé group_duration_short et group_duration_long ainsi que les fonctions compute_test_statistic(), shuffle_and_split() et plot_test_statistic_effect().
Cet exercice fait partie du cours
Introduction à la modélisation linéaire en Python
Instructions
- Utilisez
compute_test_statistic()pour obtenirtest_statistic_unshuffledà partir degroup_duration_shortetgroup_duration_long, puis utiliseznp.mean()pour calculer la taille d’effet. - Utilisez
shuffle_and_split()pour créershuffle_half1etshuffle_half2, puis utilisezcompute_test_statistic()pour calculertest_statistic_shuffled. - Créez un masque booléen
conditionoù les valeurs detest_statistic_shuffledsont supérieures ou égales àeffect_size, puis utilisez ce masque pour calculer lep_value. - Affichez le
p_valueet tracez les deux statistiques de test à l’aide deplot_test_statistic_effect().
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Compute the test stat distribution and effect size for two population groups
test_statistic_unshuffled = compute_test_statistic(____, ____)
effect_size = np.mean(____)
# Randomize the two populations, and recompute the test stat distribution
shuffled_half1, ____ = shuffle_and_split(group_duration_short, ____)
test_statistic_shuffled = compute_test_statistic(shuffled_half1, ____)
# Compute the p-value as the proportion of shuffled test stat values >= the effect size
condition = ____ >= ____
p_value = len(test_statistic_shuffled[____]) / len(test_statistic_shuffled)
# Print p-value and overplot the shuffled and unshuffled test statistic distributions
print("The p-value is = {}".format(____))
fig = plot_test_stats_and_pvalue(test_statistic_unshuffled, test_statistic_shuffled)