1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Xử lý dữ liệu với data.table trong R

Connected

Bài tập

Xử lý giá trị khuyết

Các giá trị khuyết thường được mã hóa theo nhiều cách khác nhau. Trong một số tệp, -9999 có nghĩa là giá trị khuyết; ở tệp khác, chúng có thể được mã hóa như #$##. Bạn có thể dùng đối số na.strings để cho fread() biết những giá trị nào cần được coi là giá trị khuyết.

Bạn sẽ nhập (import) tệp sau:

id,name,val1,val2
9002019291929192,Robert Whitaker,,44
9200129401349301 ,Elisa Waters,289,##
9200149429834456 , Karla Schmidt,458,29

Các giá trị khuyết được mã hóa là "##". Lưu ý fread() mặc định coi trường trống ,, là NA.

Hướng dẫn

100 XP

Nhập (import) tệp sample.csv đúng cách để đảm bảo "##" được coi là giá trị khuyết và được nhập thành NA.