Filtrer un résultat synthétisé
Dans le dernier exercice, vous avez peut‑être remarqué que le pays ayant le moins voté, Zanzibar, n’avait que 2 votes dans tout l’ensemble de données. Vous ne pouvez certainement pas tirer de conclusions solides à partir de si peu de données !
Dans une analyse progressive, lorsqu’on constate que certaines observations disposent de très peu de données alors que d’autres en ont beaucoup, on fixe généralement un seuil pour les exclure.
Cet exercice fait partie du cours
Étude de cas : analyse exploratoire de données en R
Instructions
Utilisez filter() pour retirer des données triées les pays ayant moins de 100 votes.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Filter out countries with fewer than 100 votes
by_country %>%
arrange(percent_yes)