1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Škálovatelné zpracování dat v R

Connected

cvičení

Načítání chunků jako data.frame

V předchozím příkladu jsme každý chunk načítali do zpracovací funkce jako matici pomocí mstrsplit(). To funguje dobře, pokud pracujeme s obdélníkovými daty, kde mají všechny prvky ve sloupci stejný typ. Pokud tomu tak není, může být výhodnější načíst data jako data.frame. Buď chunk načteš jako matici a pak ji převedeš na data.frame, nebo rovnou použiješ funkci dstrsplit().

Pokyny

100 XP
  • Ve funkci make_msa_table() načti každý chunk jako datový rámec.
  • Zavolej chunk.apply(), aby se data načítala po chuncích.
  • Celkové součty za každý sloupec získáš sečtením všech řádků.