1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Paralelní programování v R

Connected

Cvičení

Iterace a filtrování

Jako datový konzultant dostáváš data v nejrůznějších podobách a formátech. Klient právě přenesl 40gigabajtový CSV soubor s daty o vysokoškolských institucích z celého světa.

Mladší analytici nejsou schopni data správně načíst kvůli nedostatku paměti a není rozpočet na výpočetní zdroje potřebné ke zpracování celé datové sady. Pro aktuální analýzu potřebuješ pouze data o institucích v Austrálii. Cesta k CSV souboru je už uložená v proměnné filepath. Tvým úkolem je implementovat efektivní čtečku těchto dat. Balíčky parallel, doParallel, foreach a iterators jsou již načteny.

Pokyny

100 XP
  • Použij iterátor pro čtení řádků ze souboru filepath.
  • Výsledky spoj pomocí vhodné funkce tak, aby vznikl datový rámec.
  • Zadej paralelní operátor.