ComeçarComece de graça

Dados de sequenciamento

A unidade básica de um conjunto de dados de ChIP-seq é uma leitura de sequenciamento. Um conjunto completo geralmente contém vários milhões de leituras, armazenadas em arquivos BAM. Neste exercício, vamos ver como as leituras são representadas no R, usando leituras de uma pequena região no cromossomo 20.

As leituras já foram carregadas no R para você. Elas estão armazenadas em um objeto GAlignments chamado reads. O objeto GAlignments é estreitamente relacionado a GenomicRanges, que você pode ter visto em cursos introdutórios de Bioconductor. Esta é uma boa oportunidade para relembrar como interagir com esse tipo de objeto.

Lembre-se de que o Bioconductor fornece funções acessoras para facilitar a extração de dados. Por exemplo, start() extrai as coordenadas iniciais de todas as leituras.

Este exercício faz parte do curso

ChIP-seq com Bioconductor em R

Ver curso

Instruções do exercício

  • Imprima o objeto reads para obter um resumo dos dados.
  • Obtenha a posição inicial da primeira leitura.
  • Obtenha a posição final da última leitura.
  • Determine o número de leituras que cobrem cada posição na região selecionada, isto é, calcule a cobertura de leituras usando a função de mesmo nome.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Print the 'reads' object to obtain a summary of the data
print(___)

# Get the *start* position of the first read
start_first <- ___(reads)[1]

# Get the *end* position of the last read
end_last <- ___(___)[length(___)]

# Compute the number of reads covering each position in the selected region
cvg <- ___
Editar e executar o código