Utiliser gather pour remettre un jeu de données en ordre
Pour représenter les données de votes et de sujets jointes dans un format ordonné afin de pouvoir analyser et tracer par sujet, nous devons transformer les données de sorte que chaque ligne corresponde à une combinaison pays–vote–sujet. Cela fera passer les données de six colonnes (me, nu, di, hr, co, ec) à deux colonnes (topic et has_topic).
Cet exercice fait partie du cours
Étude de cas : analyse exploratoire de données en R
Instructions
- Chargez le package
tidyr. - Regroupez les six colonnes de sujets dans
votes_joineden une colonne appeléetopic(contenant l’une deme,nu, etc.) et une colonne appeléehas_topic(contenant 0 ou 1). Affichez le résultat sans l’enregistrer. - Les cas où
has_topicvaut 0 ne vous intéressent pas. Recommencez l’opérationgather(), mais cette fois filtrez uniquement les lignes où le sujet danstopicdécrit le vote. Enregistrez le résultat dansvotes_gathered.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Load the tidyr package
# Gather the six me/nu/di/hr/co/ec columns
# Perform gather again, then filter