1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Xử lý dữ liệu có khả năng mở rộng trong R

Connected

Bài tập

Thời gian xử lý thay đổi thế nào theo kích thước dữ liệu?

Nếu bạn xử lý mọi phần tử của hai tập dữ liệu, và một tập lớn hơn, thì tập lớn hơn sẽ mất nhiều thời gian xử lý hơn. Tuy nhiên, điều quan trọng là cần hiểu rằng mức tăng thời gian không phải lúc nào cũng tỷ lệ thuận trực tiếp với mức tăng kích thước. Nghĩa là, nếu bạn có hai tập dữ liệu và một tập lớn gấp đôi tập kia, không có gì đảm bảo rằng tập lớn sẽ mất gấp đôi thời gian để xử lý. Nó có thể mất 1,5 lần hoặc thậm chí 4 lần lâu hơn. Điều đó phụ thuộc vào các phép toán bạn dùng để xử lý tập dữ liệu.

Trong bài tập này, bạn sẽ dùng gói microbenchmark, đã được đề cập trong khóa Writing Efficient R Code.

Lưu ý: Các con số được viết bằng ký hiệu khoa học $$1e5 = 1 * 10^5 = 100,000$$

Hướng dẫn

100 XP
  • Nạp gói microbenchmark.
  • Dùng hàm microbenchmark() để so sánh thời gian sắp xếp các vector ngẫu nhiên.
  • Gọi plot() trên mb.