Données randomisées sous un modèle nul d’indépendance
Le package infer vous permet de modéliser une hypothèse nulle donnée, puis de randomiser les données pour calculer des statistiques permutées. Dans cet exercice, après avoir précisé votre hypothèse nulle, vous permuterez la variable de propriété du logement 10 fois. Ce procédé garantit l’absence de relation entre le fait d’être propriétaire et le genre ; toute différence de proportion de propriétaires entre femmes et hommes ne sera alors due qu’à la variabilité naturelle.
Cet exercice illustre les trois premières étapes du package infer :
specifypermet d’indiquer les variables réponse et explicative.hypothesizepermet d’énoncer l’hypothèse nulle.generatepermet de générer des rééchantillonnages, permutations ou simulations.
Les packages dplyr, ggplot2, NHANES et infer ont été chargés pour vous, et le jeu de données homes que vous avez créé dans l’exercice précédent est disponible dans votre espace de travail.
Cet exercice fait partie du cours
Bases de l’inférence en R
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Specify variables
homeown_perm <- homes %>%
___(___ ~ ___, success = "___")
# Print results to console
homeown_perm