Data simuleren met purrr
Als je een probleem met data wilt oplossen, moet je vaak eerst gesimuleerde data maken om te zien of je idee überhaupt mogelijk is. Je wilt bijvoorbeeld modellen testen met data waarbij de verschillen bekend zijn, om te controleren of de modellen correct werken.
In deze oefening zie je hoe dit werkt in purrr door data te simuleren voor twee populaties, a en b, van de sites: "north", "east" en "west". De twee populaties worden willekeurig getrokken uit een normale verdeling, met verschillende gemiddelden en standaarddeviaties.
Deze oefening maakt deel uit van de cursus
Basis van functioneel programmeren met purrr
Oefeninstructies
- Maak een lijst met sitenamen: "north", "east" en "west".
- Gebruik daarna
map()om een lijst met data frames te maken met drie kolommen; de eerste kolom issites.- De tweede is populatie
a, met eenmeanvan 5, een steekproefgroottenvan 200 en eensdvan (5/2). - De derde is populatie
b, met eenmeanvan 200, een steekproefgroottenvan 200 en eensdvan 15.
- De tweede is populatie
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# List of sites north, east, and west
sites <- list(___)
# Create a list of data frames, each with a years, a, and b column
list_of_df <- map(___,
~___(___ = .x,
a = rnorm(mean = ___, n = ___, sd = ___),
b = rnorm(mean = ___, n = ___, sd = ___)))
list_of_df