Lectura de archivos BAM
Para empezar, vas a leer lecturas mapeadas desde un archivo BAM en R. Estos archivos almacenan información sobre la alineación entre las secuencias leídas y el genoma de referencia en un formato binario comprimido. Cargar datos desde archivos BAM es una tarea habitual al analizar datos genómicos.
En este ejercicio, primero cargarás todas las lecturas de un archivo BAM. Esto es sencillo, pero puede requerir mucha memoria; por eso, en la segunda parte aprenderás a cargar solo las lecturas de una región de interés.
Este ejercicio forma parte del curso
ChIP-seq con Bioconductor en R
Instrucciones del ejercicio
- Carga las lecturas del archivo chr20_bam usando la función
readGAlignments(). - Crea un objeto
BamViewspara chr20_bam que cubra la región 29805000 - 29820000 del cromosoma 20. - Usa de nuevo
readGAlignments()para cargar solo las lecturas dentro de esa vista. - Inspecciona el objeto
reads_subusandostr().
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Load reads form chr20_bam file
reads <- ___(chr20_bam)
# Create a `BamViews` object for the range 29805000 - 29820000 on chromosome 20
bam_views <- ___(___, bamRanges=GRanges("chr20", IRanges(start=29805000, end=29820000)))
# Load only the reads in that view
reads_sub <- ___(___)
# Inspect the `reads_sub` object
___(reads_sub)