Distribution nulle par échantillonnage de la pente
Dans le chapitre précédent, vous avez étudié la distribution par échantillonnage de la pente dans une population où la pente n’était pas nulle. Toutefois, pour faire de l’inférence, vous devez en général connaître la distribution d’échantillonnage de la pente sous l’hypothèse qu’il n’existe aucune relation entre la variable explicative et la variable réponse. De plus, dans la plupart des situations, vous ne connaissez pas la population d’origine des données ; la distribution nulle par échantillonnage doit donc être dérivée uniquement à partir du jeu de données initial.
Au milieu du XXe siècle, une étude a retrouvé des jumeaux monozygotes séparés à la naissance : un enfant élevé par ses parents biologiques et l’autre en famille d’accueil. Pour tenter de répondre à la question de savoir si l’intelligence relève de l’inné ou de l’acquis, les deux enfants ont passé des tests de QI. Les données ci-dessous donnent les QI des jumeaux placés en famille d’accueil (Foster est la variable réponse) et les QI des jumeaux restés dans leur famille biologique (Biological est la variable explicative).
Dans cet exercice, vous allez utiliser la fonction pull(). Cette fonction prend un data frame et renvoie une colonne sélectionnée sous forme de vecteur (similaire à $).
Cet exercice fait partie du cours
Inférence pour la régression linéaire en R
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
library(infer)
# Calculate the observed slope
# Run a lin. reg. of Foster vs. Biological on the twins data
obs_slope <- ___(___, ___) %>%
# Tidy the result
___() %>%
# Filter for rows where term equal Biological
___(___) %>%
# Pull out the estimate column
___(___)
# See the result
obs_slope