1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Giới thiệu Bioconductor trong R

Connected

Bài tập

Tự tạo biểu đồ tần suất nucleotide của bạn

Giờ là lúc bạn xem kỹ hơn tần suất nucleotide theo từng chu kỳ. Cách tốt nhất là trực quan hóa dữ liệu. Thường thì vài chu kỳ đầu khá ngẫu nhiên, sau đó tần suất nucleotide sẽ dần ổn định ở các chu kỳ tiếp theo.

Bài tập này dùng toàn bộ tệp fastq SRR1971253 với một chút tiền xử lý đã được chuẩn bị sẵn cho bạn:

library(ShortRead)
fqsample <- readFastq(dirPath = "data", 
                      pattern = "SRR1971253.fastq")
# trích xuất chuỗi đọc                      
abc <- alphabetByCycle(sread(fqsample))

# Chuyển vị các nucleotide A, C, G, T theo cột
nucByCycle <- t(abc[1:4,]) 

# Dọn dữ liệu
nucByCycle <- nucByCycle %>% 
  as_tibble() %>% # chuyển sang tibble
  mutate(cycle = 1:50) # thêm số chu kỳ

Nhiệm vụ của bạn là vẽ biểu đồ Tần suất nucleotide theo Chu kỳ bằng các hàm của tidyverse!

Hướng dẫn

100 XP
  • Dùng glimpse() với đối tượng nucByCycle để xem nhanh dữ liệu.
  • Pivot các ký tự nucleotide trong alphabet bằng pivot_longer() và tạo cột count mới.
  • Vẽ biểu đồ đường với cycle trên trục x và count trên trục y, tô màu theo alphabet.