Pour quel objectif de prêt la moyenne est-elle différente ?
Avant d’examiner d’autres facteurs que purpose_recode susceptibles d’influencer le montant financé d’un prêt, voyons quelles moyennes de purpose_recode sont différentes. Il s’agit du test post hoc mentionné dans l’exercice précédent.
Le résultat de l’ANOVA était statistiquement significatif avec une p-valeur très faible. Nous pouvons donc rejeter l’hypothèse nulle et accepter l’hypothèse alternative selon laquelle au moins une moyenne est différente. Mais laquelle ?
Nous allons utiliser le test HSD de Tukey, pour Honest Significant Difference. Pour réaliser ce test en R, vous pouvez utiliser TukeyHSD() :
TukeyHSD(aov_model, "independent_variable_name", conf.level = 0.9)
Cela exécute le test HSD de Tukey sur un certain aov_model, en examinant une variable indépendante précise "independent_variable_name", avec un conf.level de 90 %.
Cet exercice fait partie du cours
Plan d’expériences en R
Instructions
- Créez un modèle avec
aov()qui examinefunded_amnten fonction depurpose_recode. Enregistrez-le danspurpose_aov. - Utilisez
TukeyHSD()pour réaliser le test HSD de Tukey surpurpose_aovavec un niveau de confiance de 0,95. Stockez le résultat dans un objet nommétukey_output. - Nettoyez
tukey_outputavectidy()du packagebroom(déjà chargé pour vous).
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Use aov() to build purpose_aov
___ <- aov(___ ~ ___, data = ___)
# Conduct Tukey's HSD test to create tukey_output
___ <- TukeyHSD(___, "___", conf.level = ___)
# Tidy tukey_output to make sense of the results
tidy(___)