1. Learn
  2. /
  3. Courses
  4. /
  5. ChIP-seq với Bioconductor trong R

Connected

Exercise

Dữ liệu giải trình tự

Đơn vị cơ bản của một bộ dữ liệu ChIP-seq là một sequencing read. Một bộ dữ liệu đầy đủ thường gồm vài triệu read, được lưu trong các tệp BAM. Trong bài tập này, bạn sẽ xem cách các read được biểu diễn trong R, với dữ liệu từ một vùng nhỏ trên nhiễm sắc thể 20.

Các read đã được nạp sẵn vào R. Chúng được lưu trong một đối tượng GAlignments tên là reads. Đối tượng GAlignments có liên quan chặt chẽ đến GenomicRanges, mà bạn có thể đã gặp trong các khóa học Bioconductor nhập môn. Đây là dịp tốt để bạn ôn lại cách thao tác với kiểu đối tượng này.

Hãy nhớ rằng Bioconductor cung cấp các hàm truy cập (accessor) để việc trích xuất dữ liệu dễ dàng hơn. Ví dụ, start() sẽ trích ra tọa độ bắt đầu của tất cả các read.

Instructions

100 XP
  • In đối tượng reads để xem tóm tắt dữ liệu.
  • Lấy vị trí bắt đầu của read đầu tiên.
  • Lấy vị trí kết thúc của read cuối cùng.
  • Xác định số lượng read bao phủ mỗi vị trí trong vùng đã chọn, tức là tính coverage của read bằng hàm cùng tên.