Aan de slagGa gratis aan de slag

Een gegevensset opschonen met gather

Om de samengevoegde stem- en onderwerpgegevens in een tidy formaat weer te geven zodat we per onderwerp kunnen analyseren en visualiseren, moeten we de data zo transformeren dat elke rij één combinatie land-stem-onderwerp heeft. Dit verandert de data van zes kolommen (me, nu, di, hr, co, ec) naar twee kolommen (topic en has_topic).

Deze oefening maakt deel uit van de cursus

Casestudy: Exploratory Data Analysis in R

Cursus bekijken

Oefeninstructies

  • Laad het tidyr-pakket.
  • Voeg de zes onderwerpkolommen in votes_joined samen tot één kolom topic (met waarden als me, nu, enz.) en een kolom has_topic (met 0 of 1). Print het resultaat zonder het op te slaan.
  • Je bent eigenlijk niet geïnteresseerd in de gevallen waar has_topic 0 is. Voer de gather()-bewerking opnieuw uit, maar filter ditmaal ook op alleen de rijen waar het onderwerp in topic de stem beschrijft. Sla het resultaat op als votes_gathered.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Load the tidyr package


# Gather the six me/nu/di/hr/co/ec columns



# Perform gather again, then filter


Code bewerken en uitvoeren