Densité de randomisation
Utiliser 100 répétitions permet de comprendre le mécanisme de permutation. Cependant, 100 ne suffit pas pour observer toute l’étendue des valeurs plausibles des différences nulles de proportions.
Rappelez-vous les quatre étapes de l’inférence. Ce sont les mêmes quatre étapes qui seront utilisées dans tous les exercices d’inférence de ce cours et dans les cours d’inférence statistique ultérieurs. Servez-vous des noms des fonctions pour vous remémorer le processus d’analyse.
specifypermet de définir la variable réponse et la variable explicative.hypothesizepermet d’énoncer l’hypothèse nulle.generatepermet de générer des rééchantillonnages, permutations ou simulations.calculatepermet de calculer des statistiques récapitulatives.
Dans cet exercice, vous répéterez le processus 1000 fois pour appréhender la distribution complète des différences nulles de proportions.
Cet exercice fait partie du cours
Bases de l’inférence en R
Instructions
Les packages dplyr, ggplot2, NHANES et infer ont été chargés pour vous.
- Générez 1000 différences de proportions en mélangeant la variable
HomeOwnavec la syntaxe deinfer. Rappel de la syntaxeinfer:specifyque la relation d’intérêt estHomeOwnpar rapport àGenderet qu’un succès dans ce contexte correspond à la propriété du logement,success = "Own".hypothesizeque l’hypothèse nulle est vraie avecnull = "independence"(ce qui signifie que le genre et l’accession à la propriété ne sont pas liés).generate1000 permutations ; définissezrepsà 1000.calculatela statistique avecstat = "diff in props"et l’ordrec("male", "female").
- Exécutez le code du tracé de densité pour créer une représentation lissée de la distribution des différences. Quelle forme a la courbe ?
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Perform 1000 permutations
homeown_perm <- homes %>%
# Specify HomeOwn vs. Gender, with `"Own" as success
___(___ ~ ___, success = "___") %>%
# Use a null hypothesis of independence
___(___) %>%
# Generate 1000 repetitions (by permutation)
___(reps = ___, type = "permute") %>%
# Calculate the difference in proportions (male then female)
___(___, order = ___))
# Density plot of 1000 permuted differences in proportions
ggplot(homeown_perm, aes(x = stat)) +
geom_density()