Lendo arquivos BAM
Para começar, você vai ler leituras mapeadas de um arquivo BAM no R. Esses arquivos armazenam informações sobre o alinhamento entre as sequências lidas e o genoma de referência em um formato binário compactado. Carregar dados de arquivos BAM é uma tarefa comum ao analisar dados genômicos.
Neste exercício, você primeiro vai carregar todas as leituras de um arquivo BAM. Isso é simples, mas pode exigir muita memória; por isso, na segunda parte, você vai aprender a carregar apenas as leituras de uma região de interesse.
Este exercício faz parte do curso
ChIP-seq com Bioconductor em R
Instruções do exercício
- Carregue as leituras do arquivo chr20_bam usando a função
readGAlignments(). - Crie um objeto
BamViewspara chr20_bam que cubra a região 29805000 - 29820000 no cromossomo 20. - Use
readGAlignments()novamente para carregar apenas as leituras nessa visualização. - Inspecione o objeto
reads_subusandostr().
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Load reads form chr20_bam file
reads <- ___(chr20_bam)
# Create a `BamViews` object for the range 29805000 - 29820000 on chromosome 20
bam_views <- ___(___, bamRanges=GRanges("chr20", IRanges(start=29805000, end=29820000)))
# Load only the reads in that view
reads_sub <- ___(___)
# Inspect the `reads_sub` object
___(reads_sub)