Filtrer les pays significatifs
Toutes les pentes ne sont pas significatives, et vous pouvez utiliser la p-valeur pour estimer lesquelles le sont ou non.
Cependant, lorsque vous avez beaucoup de p-valeurs, comme une par pays, vous faites face au problème des tests d’hypothèses multiples, qui impose un seuil plus strict. La fonction p.adjust() est un moyen simple de corriger cela : p.adjust(p.value) appliquée à un vecteur de p-valeurs renvoie un ensemble que vous pouvez considérer comme fiable.
Ici, vous allez ajouter deux étapes pour traiter le jeu de données slope_terms : utilisez mutate pour créer la nouvelle colonne de p-valeurs ajustées, puis filter pour ne conserver que celles inférieures au seuil de 0,05.
Cet exercice fait partie du cours
Étude de cas : analyse exploratoire de données en R
Instructions
Utilisez la fonction p.adjust() pour ajuster la colonne p.value, et enregistrez le résultat dans une nouvelle colonne p.adjusted. Ensuite, filtrez les cas où p.adjusted est inférieur à 0,05.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Filter for only the slope terms
slope_terms <- country_coefficients %>%
filter(term == "year")
# Add p.adjusted column, then filter