Usando anotações
Neste exercício, você vai usar coordenadas de genes obtidas do pacote TxDb.Hsapiens.UCSC.hg19.knownGene. Esse pacote fornece as coordenadas de todos os genes humanos conhecidos. Um objeto GRanges com coordenadas e um ID exclusivo para genes no cromossomo 20 já foi carregado para você como human_genes.
Embora esses IDs sejam úteis para identificar genes, não são fáceis de interpretar. Pode ser interessante adicionar também os símbolos de genes, que são mais legíveis para pessoas. Isso pode ser feito com a ajuda do pacote org.Hs.eg.db, que fornece mapeamentos entre diferentes conjuntos de identificadores de genes. A função select() permite obter, para cada ID, o símbolo do gene, armazenado na coluna SYMBOL. Depois de extrair essa informação, você pode adicioná-la à tabela com as localizações dos genes.
Este exercício faz parte do curso
ChIP-seq com Bioconductor em R
Instruções do exercício
- Obtenha os símbolos de genes a partir da coluna
SYMBOLde org.Hs.eg.db. - Examine a estrutura das anotações retornadas.
- Adicione os símbolos de genes a
human_genes. - Examine o resultado.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Obtain gene symbols
gene_symbol <- ___(org.Hs.eg.db, keys=human_genes$gene_id, columns="SYMBOL", keytype="ENTREZID")
# Examine the structure of the returned annotations
str(___)
# Add gene symbols to gene coordinates
human_genes$symbol <- ___
# Examine output
print(human_genes)