Statistiques aléatoires et dotplot
En permutant plusieurs fois la variable de propriété du logement, vous générez des différences de proportions compatibles avec l’hypothèse que les variables ne sont pas liées. La statistique d’intérêt est la différence de proportions, indiquée par stat = "diff in props". Après avoir calculé les statistiques aléatoires, vous les représenterez dans un dotplot.
Cet exercice illustre les quatre étapes du package infer :
specifypermet d’indiquer les variables réponse et explicative.hypothesizedéclare l’hypothèse nulle.generategénère des rééchantillonnages, permutations ou simulations.calculatecalcule les statistiques récapitulatives.
Chaque étape sera abordée tout au long du cours ; dans cet exercice, vous écrirez le code pour calculate().
Les packages dplyr, ggplot2, NHANES et infer ont été chargés pour vous. Répétez la permutation et la visualisation avec 100 différences de proportions générées en mélangeant la variable HomeOwn.
Cet exercice fait partie du cours
Bases de l’inférence en R
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Perform 100 permutations
homeown_perm <- homes %>%
specify(HomeOwn ~ Gender, success = "Own") %>%
hypothesize(null = "independence") %>%
generate(reps = 100, type = "permute") %>%
___(___, order = ___)
# Print results to console
homeown_perm