or
Deze oefening maakt deel uit van de cursus
De beste manier om datavaardigheden voor wrangling te leren, is door ze toe te passen in een concrete casestudy. Hier leer je hoe je de VN-stemgegevens opschoont en filtert met het dplyr-pakket, en hoe je ze samenvat tot kleinere, interpreteerbare eenheden.
Als je gegevens eenmaal hebt opgeschoond en samengevat, wil je ze visualiseren om trends te begrijpen en inzichten te halen. Hier gebruik je het ggplot2-pakket om trends in VN-stemgedrag binnen elk land in de tijd te verkennen.
Visualisatie helpt je één land tegelijk te begrijpen, terwijl statistisch modelleren je in staat stelt trends over veel landen te kwantificeren en samen te interpreteren. Hier leer je de pakketten tidyr, purrr en broom gebruiken om voor elk land lineaire modellen te fitten, en hun uitkomsten te begrijpen en te vergelijken.
In dit hoofdstuk leer je meerdere gerelateerde gegevenssets te combineren, bijvoorbeeld door informatie over het onderwerp van elke resolutie in je stemanalyse op te nemen. Je leert ook hoe je rommelige data omzet naar tidy data, en ziet hoe tidy data je verkenning van thema’s en landen door de tijd kan sturen.
Huidige oefening