Esplorare un file fastq
I file fastq di solito contengono migliaia o milioni di read e possono diventare molto grandi! In questo esercizio userai un piccolo sotto-campione fastq di 500 read, che entra comodamente in memoria e può essere letto interamente con la funzione readFastq().
Il file di sequenze originale proviene da Arabidopsis thaliana, fornito dall'UC Davis Genome Center. Il numero di accesso è SRR1971253 ed è stato scaricato dal Sequence Read Archive (SRA). Contiene DNA da tessuti fogliari, campionato e sequenziato su Illumina HiSeq 2000. Queste sono sequenze single-read con lunghezza di 50 paia di basi (bp).
fqsample è un oggetto ShortReadQ e contiene informazioni su read, punteggi di qualità e ID. Ora tocca a te esplorarlo!
Questo esercizio fa parte del corso
Introduzione a Bioconductor in R
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Load ShortRead
___
# Print fqsample
___