1. Nauka
  2. /
  3. Kursy
  4. /
  5. Wprowadzenie do Bioconductor w R

Connected

ćwiczenie

Stwórz własny wykres częstości nukleotydów

Czas przyjrzeć się bliżej częstości nukleotydów w poszczególnych cyklach. Najlepszym sposobem jest stworzenie wizualizacji. Zazwyczaj pierwsze cykle są nieco losowe, a następnie częstości nukleotydów powinny się stabilizować.

To ćwiczenie korzysta z kompletnego pliku fastq SRR1971253, dla którego wstępne przetwarzanie zostało już wykonane:

library(ShortRead)
fqsample <- readFastq(dirPath = "data", 
                      pattern = "SRR1971253.fastq")
# extract reads                      
abc <- alphabetByCycle(sread(fqsample))

# Transpose nucleotides A, C, G, T per column
nucByCycle <- t(abc[1:4,]) 

# Tidy dataset
nucByCycle <- nucByCycle %>% 
  as_tibble() %>% # convert to tibble
  mutate(cycle = 1:50) # add cycle numbers

Twoim zadaniem jest stworzenie wykresu częstości nukleotydów według cyklu przy użyciu funkcji z pakietu tidyverse!

Instrukcje

100 XP
  • Użyj funkcji glimpse() na obiekcie nucByCycle, aby przyjrzeć się danym.
  • Przekształć kolumny z literami nukleotydów do formatu długiego, używając pivot_longer(), i utwórz nową kolumnę count.
  • Stwórz wykres liniowy z cycle na osi x i count na osi y, pokolorowany według zmiennej alphabet.