or
Cet exercice fait partie du cours
La meilleure façon d’apprendre la préparation de données est de l’appliquer à une étude de cas concrète. Ici, vous apprendrez à nettoyer et filtrer le jeu de données des votes de l’ONU avec le package dplyr, puis à le résumer en unités plus petites et interprétables.
Une fois vos données nettoyées et résumées, vous voudrez les visualiser pour comprendre les tendances et en tirer des enseignements. Ici, vous utiliserez le package ggplot2 pour explorer les tendances des votes de l’ONU au sein de chaque pays au fil du temps.
La visualisation permet d’étudier un pays à la fois, tandis que la modélisation statistique vous aide à quantifier les tendances sur de nombreux pays et à les interpréter conjointement. Ici, vous apprendrez à utiliser les packages tidyr, purrr et broom pour ajuster des modèles linéaires pour chaque pays, puis à comprendre et comparer leurs résultats.
Dans ce chapitre, vous apprendrez à combiner plusieurs jeux de données liés, par exemple en intégrant des informations sur le thème de chaque résolution à votre analyse des votes. Vous verrez aussi comment transformer des données non « tidy » en données « tidy », et comment ces données bien structurées peuvent guider votre exploration des thématiques et des pays au fil du temps.
Exercice en cours