CommencerCommencer gratuitement

Statistiques aléatoires et dotplot

En permutant plusieurs fois la variable de propriété du logement, vous générez des différences de proportions compatibles avec l’hypothèse que les variables ne sont pas liées. La statistique d’intérêt est la différence de proportions, indiquée par stat = "diff in props". Après avoir calculé les statistiques aléatoires, vous les représenterez dans un dotplot.

Cet exercice illustre les quatre étapes du package infer :

  • specify permet d’indiquer les variables réponse et explicative.
  • hypothesize déclare l’hypothèse nulle.
  • generate génère des rééchantillonnages, permutations ou simulations.
  • calculate calcule les statistiques récapitulatives.

Chaque étape sera abordée tout au long du cours ; dans cet exercice, vous écrirez le code pour calculate().

Les packages dplyr, ggplot2, NHANES et infer ont été chargés pour vous. Répétez la permutation et la visualisation avec 100 différences de proportions générées en mélangeant la variable HomeOwn.

Cet exercice fait partie du cours

Bases de l’inférence en R

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Perform 100 permutations
homeown_perm <- homes %>%
  specify(HomeOwn ~ Gender, success = "Own") %>%
  hypothesize(null = "independence") %>% 
  generate(reps = 100, type = "permute") %>% 
  ___(___, order = ___)
  
# Print results to console
homeown_perm
Modifier et exécuter le code