1. 学ぶ
  2. /
  3. コース
  4. /
  5. Rで始めるBioconductor入門

Connected

演習

自分でヌクレオチド頻度プロットを作ってみましょう

ここでは、サイクルごとのヌクレオチド頻度を詳しく見ていきます。最適なのは可視化することです。通常、最初の数サイクルはややランダムになり、その後はサイクルが進むにつれてヌクレオチド頻度が安定していきます。

この演習では、いくつかの前処理を施した完全な fastq ファイル SRR1971253 を使用します。

library(ShortRead)
fqsample <- readFastq(dirPath = "data", 
                      pattern = "SRR1971253.fastq")
# extract reads                      
abc <- alphabetByCycle(sread(fqsample))

# Transpose nucleotides A, C, G, T per column
nucByCycle <- t(abc[1:4,]) 

# Tidy dataset
nucByCycle <- nucByCycle %>% 
  as_tibble() %>% # convert to tibble
  mutate(cycle = 1:50) # add cycle numbers

あなたのタスクは、tidyverse の関数を使って「サイクル別ヌクレオチド頻度」プロットを作成することです!

指示

100 XP
  • データの概要を確認するために、nucByCycle オブジェクトに対して glimpse() を実行します。
  • pivot_longer() を使って alphabet 内のヌクレオチド文字を縦持ちにし、新しい count 列を作成します。
  • x 軸を cycle、y 軸を count とし、alphabet で色分けした折れ線グラフを作成します。