CommencerCommencez gratuitement

Filtrer les pays significatifs

Toutes les pentes ne sont pas significatives, et vous pouvez utiliser la p-valeur pour estimer lesquelles le sont ou non.

Cependant, lorsque vous avez beaucoup de p-valeurs, comme une par pays, vous faites face au problème des tests d’hypothèses multiples, qui impose un seuil plus strict. La fonction p.adjust() est un moyen simple de corriger cela : p.adjust(p.value) appliquée à un vecteur de p-valeurs renvoie un ensemble que vous pouvez considérer comme fiable.

Ici, vous allez ajouter deux étapes pour traiter le jeu de données slope_terms : utilisez mutate pour créer la nouvelle colonne de p-valeurs ajustées, puis filter pour ne conserver que celles inférieures au seuil de 0,05.

Cet exercice fait partie du cours

<cours>Étude de cas : analyse exploratoire de données en R</cours>
Voir le cours

Instructions de l’exercice

Utilisez la fonction p.adjust() pour ajuster la colonne p.value, et enregistrez le résultat dans une nouvelle colonne p.adjusted. Ensuite, filtrez les cas où p.adjusted est inférieur à 0,05.

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Filter for only the slope terms
slope_terms <- country_coefficients %>%
  filter(term == "year")

# Add p.adjusted column, then filter


Modifier et exécuter le code