Ein fastq-File erkunden
Fastq-Dateien enthalten normalerweise Tausende oder Millionen Reads und können sehr groß werden! Für diese Übung nutzt du eine kleine fastq-Stichprobe mit 500 Reads, die problemlos in den Speicher passt und vollständig mit der Funktion readFastq() eingelesen werden kann.
Die ursprüngliche Sequenzdatei stammt von Arabidopsis thaliana und wurde vom UC Davis Genome Center bereitgestellt. Die Zugangsnummer ist SRR1971253 und wurde aus dem Sequence Read Archive (SRA) heruntergeladen. Sie enthält DNA aus Blattgewebe, gepoolt und auf einer Illumina HiSeq 2000 sequenziert. Diese Sequenzen sind Single-Read-Sequenzen mit einer Länge von 50 Basenpaaren (bp).
fqsample ist ein ShortReadQ-Objekt und enthält Informationen zu Reads, Qualitätswerten und IDs. jetzt bist du dran, es zu erkunden!
Diese Übung ist Teil des Kurses
Einführung in Bioconductor in R
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Load ShortRead
___
# Print fqsample
___