CommencerCommencer gratuitement

Distribution nulle par échantillonnage de la pente

Dans le chapitre précédent, vous avez étudié la distribution par échantillonnage de la pente dans une population où la pente n’était pas nulle. Toutefois, pour faire de l’inférence, vous devez en général connaître la distribution d’échantillonnage de la pente sous l’hypothèse qu’il n’existe aucune relation entre la variable explicative et la variable réponse. De plus, dans la plupart des situations, vous ne connaissez pas la population d’origine des données ; la distribution nulle par échantillonnage doit donc être dérivée uniquement à partir du jeu de données initial.

Au milieu du XXe siècle, une étude a retrouvé des jumeaux monozygotes séparés à la naissance : un enfant élevé par ses parents biologiques et l’autre en famille d’accueil. Pour tenter de répondre à la question de savoir si l’intelligence relève de l’inné ou de l’acquis, les deux enfants ont passé des tests de QI. Les données ci-dessous donnent les QI des jumeaux placés en famille d’accueil (Foster est la variable réponse) et les QI des jumeaux restés dans leur famille biologique (Biological est la variable explicative).

Dans cet exercice, vous allez utiliser la fonction pull(). Cette fonction prend un data frame et renvoie une colonne sélectionnée sous forme de vecteur (similaire à $).

Cet exercice fait partie du cours

Inférence pour la régression linéaire en R

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

library(infer)

# Calculate the observed slope
# Run a lin. reg. of Foster vs. Biological on the twins data
obs_slope <- ___(___, ___) %>%
  # Tidy the result
  ___() %>%   
  # Filter for rows where term equal Biological
  ___(___) %>%
  # Pull out the estimate column
  ___(___) 

# See the result
obs_slope
Modifier et exécuter le code