or
Cet exercice fait partie du cours
En inférence statistique, nous parlons le langage des probabilités. Une loi de probabilité qui décrit vos données possède des paramètres. Un objectif majeur de l’inférence statistique est donc d’estimer la valeur de ces paramètres, ce qui nous permet de décrire nos données de façon concise et sans ambiguïté et d’en tirer des conclusions. Dans ce chapitre, vous apprendrez à trouver les paramètres optimaux, ceux qui décrivent le mieux vos données.
« Se hisser par ses propres bootstraps » est une expression classique qui signifie réussir une tâche difficile par soi-même, sans aucune aide. En inférence statistique, vous voulez savoir ce qui se passerait si vous pouviez répéter votre acquisition de données un nombre infini de fois. Cette tâche est impossible, mais peut-on utiliser uniquement les données dont nous disposons pour s’approcher du même résultat qu’une infinité d’expériences ? La réponse est oui ! La technique pour y parvenir s’appelle à juste titre le bootstrap. Ce chapitre va vous présenter cet outil extraordinairement puissant.
Vous savez désormais comment définir et estimer des paramètres à partir d’un modèle. Mais une question demeure : est-il raisonnable d’observer vos données si le modèle est vrai ? Cette question est traitée par les tests d’hypothèse. Ils constituent la touche finale de l’inférence. À l’issue de ce chapitre, vous serez en mesure de formuler et tester des hypothèses avec rigueur en utilisant les hacker statistics.
Comme vous l’avez vu au chapitre précédent, les tests d’hypothèse peuvent être un peu délicats. Il faut définir l’hypothèse nulle, déterminer comment la simuler, et préciser clairement ce que « plus extrême » signifie afin de calculer la p-valeur. Comme pour toute compétence, la pratique est essentielle, et ce chapitre vous propose de bons exercices de mise en pratique des tests d’hypothèse.
Exercice en cours
Chaque année depuis plus de 40 ans, Peter et Rosemary Grant se rendent sur l’île de Daphne Major, dans l’archipel des Galápagos, et collectent des données sur les pinsons de Darwin. En mobilisant vos compétences en inférence statistique, vous passerez ce chapitre sur leurs données et observerez, grâce aux données, l’évolution à l’œuvre. Une façon enthousiasmante de conclure le cours !