Loi normale
Passons à la loi la plus reconnaissable et la plus utile : la loi normale, ou gaussienne. Dans le diaporama, nous avons brièvement évoqué sa forme en cloche et expliqué comment la loi normale, associée au théorème central limite, nous permet d’effectuer des tests d’hypothèse.
Comme dans les exercices précédents, vous allez commencer par simuler des données et examiner la distribution, puis aller un peu plus loin et étudier la probabilité que certaines observations se produisent.
Cet exercice fait partie du cours
S’entraîner aux questions d’entretien en statistiques avec Python
Instructions
- Générez les données de la distribution avec la fonction
rvs()en fixant size à 1000 ; affectez-les à la variabledata. - Affichez un histogramme
matplotlib; observez la forme de la distribution. - Étant donné une loi normale centrée réduite, quelle est la probabilité d’observer une valeur supérieure à 2 ?
- En regardant notre échantillon, quelle est la probabilité d’observer une valeur supérieure à 2 ?
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Generate normal data
from scipy.stats import norm
data = norm.rvs(size=____)
# Plot distribution
plt.hist(____)
plt.show()
# Compute and print true probability for greater than 2
true_prob = 1 - norm.cdf(____)
print(____)
# Compute and print sample probability for greater than 2
sample_prob = sum(obs > ____ for obs in data) / len(____)
print(____)