Usar anotaciones
En este ejercicio, usarás coordenadas de genes obtenidas del paquete TxDb.Hsapiens.UCSC.hg19.knownGene. Este paquete proporciona las coordenadas de todos los genes humanos conocidos. Se ha cargado para ti un objeto GRanges con coordenadas y un ID único para los genes del cromosoma 20 como human_genes.
Aunque estos IDs son útiles para identificar genes, no son fáciles de interpretar. Puede ser útil añadir también los símbolos de genes, que son más legibles para las personas. Esto se puede conseguir con ayuda del paquete org.Hs.eg.db, que ofrece correspondencias entre distintos conjuntos de identificadores de genes. La función select() te permite obtener un símbolo de gen, almacenado en la columna SYMBOL, para cada ID. Una vez que hayas extraído esta información, podrás añadirla a la tabla con las ubicaciones de los genes.
Este ejercicio forma parte del curso
ChIP-seq con Bioconductor en R
Instrucciones del ejercicio
- Obtén los símbolos de genes de la columna
SYMBOLde org.Hs.eg.db. - Examina la estructura de las anotaciones devueltas.
- Añade los símbolos de genes a
human_genes. - Examina el resultado.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Obtain gene symbols
gene_symbol <- ___(org.Hs.eg.db, keys=human_genes$gene_id, columns="SYMBOL", keytype="ENTREZID")
# Examine the structure of the returned annotations
str(___)
# Add gene symbols to gene coordinates
human_genes$symbol <- ___
# Examine output
print(human_genes)