1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Kết hợp dữ liệu với data.table trong R

Connected

Bài tập

Join với giá trị thiếu

Hai data.table mới đã được nạp vào phiên R của bạn: heart và cardio. Mỗi bảng chứa một tập các microarray probes mà bạn tìm thấy có liên quan đến bệnh tim trong hai nghiên cứu riêng biệt*. Mỗi probe đo mức độ biểu hiện của một gene. Mỗi gene có thể được đo bởi một hoặc nhiều probe, và một số probe không có bất kỳ chú giải gene nào đã biết trong trình tự tham chiếu hệ gen người. Hai nghiên cứu này sử dụng các nền tảng microarray khác nhau, dùng các probe khác nhau để đo mỗi gene. Mục tiêu của bạn là tìm các gene có mối liên hệ với bệnh tim được lặp lại nhất quán ở cả hai nghiên cứu.

* Lưu ý: các mối liên hệ được tạo ngẫu nhiên, không đại diện cho bất kỳ phát hiện sinh học thực sự hay bộ dữ liệu thật nào.

Hướng dẫn

100 XP
  • Dùng hàm merge(), thực hiện inner join cardio với heart cùng đối số phù hợp để bỏ qua mọi lỗi bạn gặp phải.
  • Loại bỏ các probe ở cả hai data.table không có chú giải gene (tức là loại các hàng có giá trị thiếu trong cột gene).
  • Lặp lại inner join với các data.table mới để thu được một data.table các mối liên hệ có thể tái lập giữa gene và bệnh tim.