1. 学ぶ
  2. /
  3. コース
  4. /
  5. Rで学ぶBioconductorによるChIP-seq

Connected

演習

BAMファイルを読み込む

まずは、マッピング済みリードをBAMファイルからRに読み込みます。BAMファイルは、リード配列と参照ゲノムのアラインメント情報を圧縮バイナリ形式で保存しています。ゲノムデータを解析する際には、BAMファイルからのデータ読み込みはよく行う作業です。

この演習では、最初にbamファイルからすべてのリードを読み込みます。手順自体は簡単ですが、多くのメモリを必要とする場合があります。そこで後半では、関心領域のリードだけを読み込む方法を学びます。

指示

100 XP
  • readGAlignments() 関数を使って、chr20_bam ファイルからリードを読み込みます。
  • 染色体20の 29805000 〜 29820000 の領域をカバーする、chr20_bam 用の BamViews オブジェクトを作成します。
  • そのビュー内のリードのみを読み込むために、再度 readGAlignments() を使います。
  • str() を使って reads_sub オブジェクトを確認します。