IniziaInizia gratis

Bootstrap dell’età media materna

L’età materna, ovvero l’età della madre al momento del parto, è un indicatore importante della salute neonatale in una popolazione. Un’età materna troppo alta o troppo bassa può avere effetti negativi sull’esito del parto.

Lavori per il Department of Health degli Stati Uniti come Data Analyst. Ti viene fornita una lista, ls_df, di 51 data frame, uno per ciascuno stato USA e Washington DC. Ogni data frame contiene la colonna maternal_age. Il tuo responsabile vuole che tu esegua un bootstrap della distribuzione della media dell’età materna per ciascuno stato. Hai già scritto un ciclo per fare il bootstrap su un singolo data frame. Ora devi parallelizzare questo calcolo. Il pacchetto parallel è già stato caricato per te.

Questo esercizio fa parte del corso

Programmazione parallela in R

Visualizza il corso

Istruzioni dell'esercizio

  • Incapsula il ciclo di bootstrap in una funzione che restituisca la distribuzione della media.
  • Configura un cluster di quattro core.
  • Applica in parallelo la funzione di bootstrap a ls_df usando parLapply().
  • Arresta il cluster quando tutte le elaborazioni sono concluse.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Wrap the loop into a function
boot_mean <- ___ (df) ___
  est <- rep(0, 1e3)
  for (i in 1:1e3) {
    b <- sample(df$mother_age, replace = T)
    est[i] <- mean(b)
  }
  return(est)
___
# Make a cluster of four
cl <- ___
# Apply function to ls_df in parallel
state_dist <- ___
# Stop cluster
___(cl)
Modifica ed esegui il codice