CommencerCommencer gratuitement

Utiliser gather pour remettre un jeu de données en ordre

Pour représenter les données de votes et de sujets jointes dans un format ordonné afin de pouvoir analyser et tracer par sujet, nous devons transformer les données de sorte que chaque ligne corresponde à une combinaison pays–vote–sujet. Cela fera passer les données de six colonnes (me, nu, di, hr, co, ec) à deux colonnes (topic et has_topic).

Cet exercice fait partie du cours

Étude de cas : analyse exploratoire de données en R

Afficher le cours

Instructions

  • Chargez le package tidyr.
  • Regroupez les six colonnes de sujets dans votes_joined en une colonne appelée topic (contenant l’une de me, nu, etc.) et une colonne appelée has_topic (contenant 0 ou 1). Affichez le résultat sans l’enregistrer.
  • Les cas où has_topic vaut 0 ne vous intéressent pas. Recommencez l’opération gather(), mais cette fois filtrez uniquement les lignes où le sujet dans topic décrit le vote. Enregistrez le résultat dans votes_gathered.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Load the tidyr package


# Gather the six me/nu/di/hr/co/ec columns



# Perform gather again, then filter


Modifier et exécuter le code