Lijstkolommen
Deze "geneste" data heeft een interessante structuur. De tweede kolom, data, is een lijst: een type R-object dat nog niet aan bod is gekomen in deze cursus en waarmee je complexe objecten per rij kunt opslaan. Dat komt doordat elk item in de kolom data zelf een data frame is.
# A tibble: 200 × 2
country data
<chr> <list>
1 Afghanistan <tibble [34 × 3]>
2 Argentina <tibble [34 × 3]>
3 Australia <tibble [34 × 3]>
4 Belarus <tibble [34 × 3]>
5 Belgium <tibble [34 × 3]>
6 Bolivia, Plurinational State of <tibble [34 × 3]>
7 Brazil <tibble [34 × 3]>
8 Canada <tibble [34 × 3]>
9 Chile <tibble [34 × 3]>
10 Colombia <tibble [34 × 3]>
Je kunt nested$data gebruiken om deze lijstkolom te benaderen en dubbele vierkante haken gebruiken om een specifiek element op te vragen. Bijvoorbeeld, nested$data[[1]] geeft je het data frame met de stemgeschiedenis van Afghanistan (de percent_yes per jaar), omdat Afghanistan op de eerste rij van de tabel staat.
Deze oefening maakt deel uit van de cursus
Casestudy: Exploratory Data Analysis in R
Oefeninstructies
Print het data frame uit de kolom data dat de gegevens voor Brazilië bevat.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# All countries are nested besides country
nested <- by_year_country %>%
nest(-country)
# Print the nested data for Brazil