CommencerCommencer gratuitement

Visualiser la valeur p

Dans cet exercice, vous allez visualiser la valeur p, c’est‑à‑dire la probabilité que l’effet (ou la « vitesse ») que nous avons estimé résulte de la variation aléatoire de l’échantillon. Votre objectif est de la représenter comme la fraction de points de la distribution de la statistique de test après mélange qui se trouvent à droite de la moyenne de la statistique de test (la « taille d’effet ») calculée à partir des échantillons non mélangés.

Pour vous aider à démarrer, nous avons préchargé group_duration_short et group_duration_long ainsi que les fonctions compute_test_statistic(), shuffle_and_split() et plot_test_statistic_effect().

Cet exercice fait partie du cours

Introduction à la modélisation linéaire en Python

Afficher le cours

Instructions

  • Utilisez compute_test_statistic() pour obtenir test_statistic_unshuffled à partir de group_duration_short et group_duration_long, puis utilisez np.mean() pour calculer la taille d’effet.
  • Utilisez shuffle_and_split() pour créer shuffle_half1 et shuffle_half2, puis utilisez compute_test_statistic() pour calculer test_statistic_shuffled.
  • Créez un masque booléen condition où les valeurs de test_statistic_shuffled sont supérieures ou égales à effect_size, puis utilisez ce masque pour calculer le p_value.
  • Affichez le p_value et tracez les deux statistiques de test à l’aide de plot_test_statistic_effect().

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Compute the test stat distribution and effect size for two population groups
test_statistic_unshuffled = compute_test_statistic(____, ____)
effect_size = np.mean(____)

# Randomize the two populations, and recompute the test stat distribution
shuffled_half1, ____ = shuffle_and_split(group_duration_short, ____)
test_statistic_shuffled = compute_test_statistic(shuffled_half1, ____)

# Compute the p-value as the proportion of shuffled test stat values >= the effect size
condition = ____ >= ____
p_value = len(test_statistic_shuffled[____]) / len(test_statistic_shuffled)

# Print p-value and overplot the shuffled and unshuffled test statistic distributions
print("The p-value is = {}".format(____))
fig = plot_test_stats_and_pvalue(test_statistic_unshuffled, test_statistic_shuffled)
Modifier et exécuter le code