1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Úvod do Bioconductoru v R

Connected

cvičení

Vyzkoušej si vlastní graf četnosti nukleotidů

Teď se blíže podíváme na četnost nukleotidů v jednotlivých cyklech. Nejlepší způsob, jak to znázornit, je vizualizace. Obvykle bývají první cykly trochu náhodné a pak by se četnost nukleotidů měla s dalšími cykly stabilizovat.

Toto cvičení využívá kompletní soubor fastq SRR1971253 s předpřipraveným zpracováním:

library(ShortRead)
fqsample <- readFastq(dirPath = "data", 
                      pattern = "SRR1971253.fastq")
# extract reads                      
abc <- alphabetByCycle(sread(fqsample))

# Transpose nucleotides A, C, G, T per column
nucByCycle <- t(abc[1:4,]) 

# Tidy dataset
nucByCycle <- nucByCycle %>% 
  as_tibble() %>% # convert to tibble
  mutate(cycle = 1:50) # add cycle numbers

Tvým úkolem je sestrojit graf četnosti nukleotidů podle cyklu pomocí funkcí z tidyverse!

Pokyny

100 XP
  • Pomocí glimpse() se podívej na objekt nucByCycle a prohlédni si data.
  • Pivotuj písmena nukleotidů do sloupce alphabet pomocí pivot_longer() a vytvoř nový sloupec count.
  • Vytvoř spojnicový graf s cycle na ose x a count na ose y, obarvený podle alphabet.