CommencerCommencer gratuitement

Données randomisées sous un modèle nul d’indépendance

Le package infer vous permet de modéliser une hypothèse nulle donnée, puis de randomiser les données pour calculer des statistiques permutées. Dans cet exercice, après avoir précisé votre hypothèse nulle, vous permuterez la variable de propriété du logement 10 fois. Ce procédé garantit l’absence de relation entre le fait d’être propriétaire et le genre ; toute différence de proportion de propriétaires entre femmes et hommes ne sera alors due qu’à la variabilité naturelle.

Cet exercice illustre les trois premières étapes du package infer :

  • specify permet d’indiquer les variables réponse et explicative.
  • hypothesize permet d’énoncer l’hypothèse nulle.
  • generate permet de générer des rééchantillonnages, permutations ou simulations.

Les packages dplyr, ggplot2, NHANES et infer ont été chargés pour vous, et le jeu de données homes que vous avez créé dans l’exercice précédent est disponible dans votre espace de travail.

Cet exercice fait partie du cours

Bases de l’inférence en R

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Specify variables
homeown_perm <- homes %>%
  ___(___ ~ ___, success = "___")

# Print results to console
homeown_perm
Modifier et exécuter le code