ComeçarComece de graça

Filtrando leituras

Neste exercício, você vai limpar ainda mais os dados removendo leituras com alinhamentos de baixa qualidade. Para fazer isso, você precisa carregar as qualidades de alinhamento do arquivo BAM. Elas ficam armazenadas no campo mapq.

Este exercício faz parte do curso

ChIP-seq com Bioconductor em R

Ver curso

Instruções do exercício

  • Carregue reads com as informações de qualidade de alinhamento anexadas a cada leitura.
  • Identifique todos os alinhamentos com qualidade de pelo menos 20.
  • Crie um boxplot comparando as distribuições de qualidade de alinhamento entre os grupos de alta e baixa qualidade.
  • Remova todos os alinhamentos de baixa qualidade.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Load reads with mapping qualities by requesting the "mapq" entries
reads <- readGAlignments(bam_file, param=ScanBamParam(what=___))

# Identify good quality alignments
high_mapq <- mcols(reads)$mapq >= ___

# Examine mapping quality distribution for high and low quality alignments
___(mcols(reads)$mapq ~ high_mapq, xlab="good quality alignments", ylab="mapping quality")

# Remove low quality alignments
reads_good <- subset(reads, ___)
Editar e executar o código