Aan de slagGa gratis aan de slag

Data simuleren met purrr

Als je een probleem met data wilt oplossen, moet je vaak eerst gesimuleerde data maken om te zien of je idee überhaupt mogelijk is. Je wilt bijvoorbeeld modellen testen met data waarbij de verschillen bekend zijn, om te controleren of de modellen correct werken.

In deze oefening zie je hoe dit werkt in purrr door data te simuleren voor twee populaties, a en b, van de sites: "north", "east" en "west". De twee populaties worden willekeurig getrokken uit een normale verdeling, met verschillende gemiddelden en standaarddeviaties.

Deze oefening maakt deel uit van de cursus

Basis van functioneel programmeren met purrr

Cursus bekijken

Oefeninstructies

  • Maak een lijst met sitenamen: "north", "east" en "west".
  • Gebruik daarna map() om een lijst met data frames te maken met drie kolommen; de eerste kolom is sites.
    • De tweede is populatie a, met een mean van 5, een steekproefgrootte n van 200 en een sd van (5/2).
    • De derde is populatie b, met een mean van 200, een steekproefgrootte n van 200 en een sd van 15.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# List of sites north, east, and west
sites <- list(___)

# Create a list of data frames, each with a years, a, and b column
list_of_df <-  map(___,  
  ~___(___ = .x,
       a = rnorm(mean = ___, n = ___, sd = ___),
       b = rnorm(mean = ___, n = ___, sd = ___)))

list_of_df
Code bewerken en uitvoeren