IniziaInizia gratis

Esplorare un file fastq

I file fastq di solito contengono migliaia o milioni di read e possono diventare molto grandi! In questo esercizio userai un piccolo sotto-campione fastq di 500 read, che entra comodamente in memoria e può essere letto interamente con la funzione readFastq().

Il file di sequenze originale proviene da Arabidopsis thaliana, fornito dall'UC Davis Genome Center. Il numero di accesso è SRR1971253 ed è stato scaricato dal Sequence Read Archive (SRA). Contiene DNA da tessuti fogliari, campionato e sequenziato su Illumina HiSeq 2000. Queste sono sequenze single-read con lunghezza di 50 paia di basi (bp).

fqsample è un oggetto ShortReadQ e contiene informazioni su read, punteggi di qualità e ID. Ora tocca a te esplorarlo!

Questo esercizio fa parte del corso

Introduzione a Bioconductor in R

Visualizza il corso

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Load ShortRead
___

# Print fqsample
___
Modifica ed esegui il codice