Filtrado de lecturas
En este ejercicio, vas a limpiar aún más los datos eliminando las lecturas con alineamientos de baja calidad. Para poder hacerlo, necesitas cargar las calidades de alineamiento desde el archivo BAM. Estas están guardadas en el campo mapq.
Este ejercicio forma parte del curso
ChIP-seq con Bioconductor en R
Instrucciones del ejercicio
- Carga
readscon la información de la calidad de alineamiento asociada a cada lectura. - Identifica todos los alineamientos con una calidad de al menos 20.
- Crea un diagrama de cajas para comparar la distribución de calidades de alineamiento entre los grupos de alta y baja calidad.
- Elimina todos los alineamientos de baja calidad.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Load reads with mapping qualities by requesting the "mapq" entries
reads <- readGAlignments(bam_file, param=ScanBamParam(what=___))
# Identify good quality alignments
high_mapq <- mcols(reads)$mapq >= ___
# Examine mapping quality distribution for high and low quality alignments
___(mcols(reads)$mapq ~ high_mapq, xlab="good quality alignments", ylab="mapping quality")
# Remove low quality alignments
reads_good <- subset(reads, ___)