ComenzarEmpieza gratis

Explorando un archivo fastq

Los archivos fastq suelen contener miles o millones de lecturas y pueden ser muy grandes. En este ejercicio usarás una submuestra pequeña de fastq con 500 lecturas, que cabe sin problemas en memoria y puede leerse completa con la función readFastq().

El archivo de secuencias original proviene de Arabidopsis thaliana, facilitado por el UC Davis Genome Center. El número de acceso es SRR1971253 y se descargó del Sequence Read Archive (SRA). Contiene ADN de tejido foliar, agrupado y secuenciado en Illumina HiSeq 2000. Estas son lecturas single-read con una longitud de 50 pares de bases (bp).

fqsample es un objeto ShortReadQ y contiene información sobre las lecturas, las puntuaciones de calidad y los ids. ¡Te toca explorarlo!

Este ejercicio forma parte del curso

Introducción a Bioconductor en R

Ver curso

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Load ShortRead
___

# Print fqsample
___
Editar y ejecutar código