Een gegevensset opschonen met gather
Om de samengevoegde stem- en onderwerpgegevens in een tidy formaat weer te geven zodat we per onderwerp kunnen analyseren en visualiseren, moeten we de data zo transformeren dat elke rij één combinatie land-stem-onderwerp heeft. Dit verandert de data van zes kolommen (me, nu, di, hr, co, ec) naar twee kolommen (topic en has_topic).
Deze oefening maakt deel uit van de cursus
Casestudy: Exploratory Data Analysis in R
Oefeninstructies
- Laad het
tidyr-pakket. - Voeg de zes onderwerpkolommen in
votes_joinedsamen tot één kolomtopic(met waarden alsme,nu, enz.) en een kolomhas_topic(met 0 of 1). Print het resultaat zonder het op te slaan. - Je bent eigenlijk niet geïnteresseerd in de gevallen waar
has_topic0 is. Voer degather()-bewerking opnieuw uit, maar filter ditmaal ook op alleen de rijen waar het onderwerp intopicde stem beschrijft. Sla het resultaat op alsvotes_gathered.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Load the tidyr package
# Gather the six me/nu/di/hr/co/ec columns
# Perform gather again, then filter