1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Xử lý dữ liệu có khả năng mở rộng trong R

Connected

Bài tập

Đọc các khối dữ liệu (chunk) dưới dạng data.frame

Trong ví dụ trước, bạn đã đọc từng khối dữ liệu vào hàm xử lý dưới dạng ma trận bằng mstrsplit(). Cách này phù hợp khi dữ liệu có dạng hình chữ nhật và kiểu phần tử trong mỗi cột đều giống nhau. Khi không phải vậy, bạn có thể muốn đọc dữ liệu dưới dạng data.frame. Việc này có thể thực hiện bằng cách đọc một khối vào dưới dạng ma trận rồi chuyển đổi sang data.frame, hoặc bạn có thể dùng hàm dstrsplit().

Hướng dẫn

100 XP
  • Trong hàm make_msa_table(), hãy đọc mỗi khối dưới dạng data frame.
  • Gọi chunk.apply() để đọc dữ liệu theo từng khối.
  • Lấy tổng số đếm cho mỗi cột bằng cách cộng tất cả các hàng.