1. Nauka
  2. /
  3. Kursy
  4. /
  5. Wprowadzenie do Bioconductor w R

Connected

ćwiczenie

Eksploracja pliku fastq

Pliki fastq zazwyczaj zawierają tysiące lub miliony odczytów i mogą być bardzo duże! W tym ćwiczeniu skorzystasz z małej próbki fastq zawierającej 500 odczytów, która bez problemu mieści się w pamięci i może być wczytana w całości za pomocą funkcji readFastq().

Oryginalny plik sekwencji pochodzi z Arabidopsis thaliana i został udostępniony przez UC Davis Genome Center. Numer akcesji to SRR1971253 – plik pobrano z repozytorium Sequence Read Archive (SRA). Zawiera on DNA z tkanki liści, zebranej i zsekwencjonowanej na platformie Illumina HiSeq 2000. Są to sekwencje jednokońcowe o długości 50 par zasad (bp).

fqsample jest obiektem klasy ShortReadQ i zawiera informacje o odczytach, wynikach jakości oraz identyfikatorach. Czas go zbadać!

Instrukcje 1/3

undefined XP
    1
    2
    3
  • Wczytaj pakiet ShortRead i wyświetl obiekt fqsample.