Simulare dati con purrr
Spesso, quando proviamo a risolvere un problema con i dati, dobbiamo prima creare dei dati simulati per verificare se la nostra idea è realizzabile. Per esempio, potresti voler testare dei modelli con dati che presentano differenze note, per controllare che i modelli funzionino correttamente.
In questo esercizio vedrai come farlo con purrr, simulando dati per due popolazioni, a e b, dai siti: "north", "east" e "west". Le due popolazioni saranno campionate casualmente da una distribuzione normale, con medie e deviazioni standard diverse.
Questo esercizio fa parte del corso
Le basi della programmazione funzionale con purrr
Istruzioni dell'esercizio
- Crea un elenco con i nomi dei siti, "north", "east" e "west".
- Poi usa
map()per creare un elenco di data frame con tre colonne: la prima colonna èsites.- La seconda è la popolazione
a, conmeanpari a 5, dimensione del campionenpari a 200 esdpari a (5/2). - La terza è la popolazione
b, conmeanpari a 200, dimensione del campionenpari a 200 esdpari a 15.
- La seconda è la popolazione
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# List of sites north, east, and west
sites <- list(___)
# Create a list of data frames, each with a years, a, and b column
list_of_df <- map(___,
~___(___ = .x,
a = rnorm(mean = ___, n = ___, sd = ___),
b = rnorm(mean = ___, n = ___, sd = ___)))
list_of_df