1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Paralelní programování v R

Connected

Cvičení

Ladění korelací

Pracuješ pro americké Ministerstvo zdravotnictví. Tvůj tým zkoumá, zda vícečetné těhotenství (dvojčata, trojčata apod.) koreluje s vyšším přírůstkem hmotnosti v průběhu těhotenství. Výsledné korelace ses spočítal/a, ale tvoje hodnoty se výrazně liší od odhadů jiného analytika. Ten upozornil, že tvoje data nezaznamenávají hodnoty přírůstku hmotnosti vyšší než 99 liber. Rozhodl/a ses výpočet zopakovat a tentokrát chceš zalogovat maximální hodnotu přírůstku hmotnosti.

V pracovním prostředí máš k dispozici seznam datových rámců ls_df. Každý prvek ls_df obsahuje data o porodech pro jeden stát. Napsal/a jsi smyčku foreach, která výpočet spouští paralelně.

Balíčky foreach a doParallel jsou již načteny.

Pokyny

100 XP
  • Vytvoř cluster se čtyřmi jádry.
  • Zadej soubor state_log.txt, do kterého se budou logovat zprávy z clusteru.
  • V těle smyčky zaloguj maximální hodnotu sloupce weight_gain_pounds v datovém rámci df.
  • Načti soubor state_log.txt a zkontroluj vypsané zprávy.