1. Învăţa
  2. /
  3. Courses
  4. /
  5. Giới thiệu Bioconductor trong R

Connected

exercise

Khám phá một tệp fastq

Các tệp fastq thường chứa hàng nghìn hoặc hàng triệu reads và có thể rất lớn! Trong bài này, bạn sẽ dùng một mẫu con fastq nhỏ gồm 500 reads, đủ gọn để nằm trong bộ nhớ và có thể đọc toàn bộ bằng hàm readFastq().

Tệp trình tự gốc đến từ Arabidopsis thaliana, do UC Davis Genome Center cung cấp. Số truy cập là SRR1971253 và được tải từ Sequence Read Archive (SRA). Dữ liệu chứa DNA từ mô lá, được gộp và giải trình tự trên Illumina HiSeq 2000. Đây là các trình tự single-read với độ dài 50 base pairs (bp).

fqsample là một đối tượng ShortReadQ và chứa thông tin về reads, điểm chất lượng và id. Đến lượt bạn khám phá nó!

Instrucțiuni 1 / 3

undefined XP
    1
    2
    3
  • Nạp gói ShortRead và in fqsample để xem nội dung.