CommencerCommencer gratuitement

Densité de randomisation

Utiliser 100 répétitions permet de comprendre le mécanisme de permutation. Cependant, 100 ne suffit pas pour observer toute l’étendue des valeurs plausibles des différences nulles de proportions.

Rappelez-vous les quatre étapes de l’inférence. Ce sont les mêmes quatre étapes qui seront utilisées dans tous les exercices d’inférence de ce cours et dans les cours d’inférence statistique ultérieurs. Servez-vous des noms des fonctions pour vous remémorer le processus d’analyse.

  • specify permet de définir la variable réponse et la variable explicative.
  • hypothesize permet d’énoncer l’hypothèse nulle.
  • generate permet de générer des rééchantillonnages, permutations ou simulations.
  • calculate permet de calculer des statistiques récapitulatives.

Dans cet exercice, vous répéterez le processus 1000 fois pour appréhender la distribution complète des différences nulles de proportions.

Cet exercice fait partie du cours

Bases de l’inférence en R

Afficher le cours

Instructions

Les packages dplyr, ggplot2, NHANES et infer ont été chargés pour vous.

  • Générez 1000 différences de proportions en mélangeant la variable HomeOwn avec la syntaxe de infer. Rappel de la syntaxe infer :
    • specify que la relation d’intérêt est HomeOwn par rapport à Gender et qu’un succès dans ce contexte correspond à la propriété du logement, success = "Own".
    • hypothesize que l’hypothèse nulle est vraie avec null = "independence" (ce qui signifie que le genre et l’accession à la propriété ne sont pas liés).
    • generate 1000 permutations ; définissez reps à 1000.
    • calculate la statistique avec stat = "diff in props" et l’ordre c("male", "female").
  • Exécutez le code du tracé de densité pour créer une représentation lissée de la distribution des différences. Quelle forme a la courbe ?

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Perform 1000 permutations
homeown_perm <- homes %>%
  # Specify HomeOwn vs. Gender, with `"Own" as success
  ___(___ ~ ___, success = "___") %>%
  # Use a null hypothesis of independence
  ___(___) %>% 
  # Generate 1000 repetitions (by permutation)
  ___(reps = ___, type = "permute") %>% 
  # Calculate the difference in proportions (male then female)
  ___(___, order = ___))

# Density plot of 1000 permuted differences in proportions
ggplot(homeown_perm, aes(x = stat)) + 
  geom_density()
Modifier et exécuter le code