1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Xử lý dữ liệu có khả năng mở rộng trong R

Connected

Bài tập

Đọc dữ liệu raw và chuyển thành cấu trúc dữ liệu

Như đã đề cập, một phần lý do khiến iotools nhanh là vì nó tách riêng bước đọc dữ liệu từ ổ đĩa khỏi bước chuyển đổi dữ liệu nhị phân thành data.frame hoặc matrix. Dữ liệu ở định dạng nhị phân được sao chép từ ổ đĩa vào bộ nhớ dưới dạng các đối tượng raw. Các đối tượng raw này sau đó được truyền vào các hàm đã tối ưu để chuyển chúng thành đối tượng data.frame hoặc matrix.

Trong bài tập này, bạn sẽ học cách tách riêng việc đọc dữ liệu từ đĩa (dùng hàm readAsRaw()), rồi chuyển đổi dữ liệu nhị phân raw đó thành matrix hoặc data.frame (dùng các hàm mstrsplit() và dstrsplit()).

Hướng dẫn

100 XP
  • Đọc "mortgage-sample.csv" dưới dạng một vector raw.
  • Chuyển nội dung vector raw thành matrix kiểu số nguyên (integer).
  • Chuyển nội dung vector raw thành data.frame với 16 cột kiểu số nguyên.