1. Learn
  2. /
  3. 课程
  4. /
  5. R 的可扩展数据处理

Connected

道练习

对 chunk.apply 的调用进行并行化

chunk.apply() 函数也可以利用并行进程来更快地处理数据。当在 Linux 和 Unix 机器(包括 Mac)上将 CH.PARALLEL 参数设置为大于 1 的值时,多个进程会同时读取并处理数据,从而缩短执行时间。在 Windows 上会忽略 CH.PARALLEL 参数。

说明

100 XP
  • 对函数 iotools_read_fun() 进行基准测试,先使用 1 个进程,然后使用 3 个并行进程。