Data simuleren met purrr

Als je een probleem met data wilt oplossen, moet je vaak eerst gesimuleerde data maken om te zien of je idee überhaupt mogelijk is. Je wilt bijvoorbeeld modellen testen met data waarbij de verschillen bekend zijn, om te controleren of de modellen correct werken.

In deze oefening zie je hoe dit werkt in purrr door data te simuleren voor twee populaties, a en b, van de sites: "north", "east" en "west". De twee populaties worden willekeurig getrokken uit een normale verdeling, met verschillende gemiddelden en standaarddeviaties.

Deze oefening maakt deel uit van de cursus

Basis van functioneel programmeren met purrr

Bekijk cursus

Oefeninstructies

Maak een lijst met sitenamen: "north", "east" en "west".
Gebruik daarna map() om een lijst met data frames te maken met drie kolommen; de eerste kolom is sites.
- De tweede is populatie a, met een mean van 5, een steekproefgrootte n van 200 en een sd van (5/2).
- De derde is populatie b, met een mean van 200, een steekproefgrootte n van 200 en een sd van 15.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# List of sites north, east, and west
sites <- list(___)

# Create a list of data frames, each with a years, a, and b column
list_of_df <-  map(___,  
  ~___(___ = .x,
       a = rnorm(mean = ___, n = ___, sd = ___),
       b = rnorm(mean = ___, n = ___, sd = ___)))

list_of_df

Code bewerken en uitvoeren