1. 学ぶ
  2. /
  3. コース
  4. /
  5. Rで始めるBioconductor入門

Connected

演習

fastq ファイルを探索する

Fastq ファイルには通常、数千〜数百万リードが含まれ、サイズが非常に大きくなることがあります。この演習では、メモリに簡単に収まり、関数 readFastq() で全体を読み込める 500 リードの小さな fastq サブサンプルを使います。

元の配列ファイルは UC Davis Genome Center 提供の Arabidopsis thaliana に由来します。アクセッション番号は SRR1971253 で、Sequence Read Archive (SRA) からダウンロードしました。これは葉組織からの DNA をプールし、Illumina HiSeq 2000 でシーケンスしたものです。配列は長さ 50 塩基対 (bp) の single-read シーケンスです。

fqsample は ShortReadQ オブジェクトで、リード、クオリティスコア、ID に関する情報を含みます。さっそく探索してみましょう!

指示1 / 3

undefined XP
    1
    2
    3
  • ShortRead パッケージを読み込み、fqsample を表示して中身を確認します。