Entender el impacto en las rutas
Las rutas (pathways) son otra forma útil de agrupar genes. En este ejercicio, vas a revisar los resultados de un análisis de enriquecimiento de rutas que examina los picos más marcados en las muestras de tumor primario. El objeto enrich_primary contiene los resultados. Es una lista con cuatro entradas. Tu principal interés ahora está en results, un data frame con los resultados de enriquecimiento ordenados por significación. Incluye el ID y el nombre de los conjuntos de genes y los genes asociados a picos que forman parte del conjunto. Aquí, los genes se informan como IDs de Entrez. Puedes usar la base de datos que proporciona el paquete org.Hs.eg.db para convertir entre IDs de Entrez y símbolos génicos. La función select() ofrece una interfaz práctica para seleccionar entradas de la columna SYMBOL usando el tipo de clave ENTREZID.
Este ejercicio forma parte del curso
ChIP-seq con Bioconductor en R
Instrucciones del ejercicio
- Examina los conjuntos de genes principales.
- Extrae los IDs de genes del conjunto con mayor ranking.
- Divide los IDs de genes en un vector.
- Convierte los IDs de genes a símbolos génicos.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Examine the top gene sets
head(___$results)
# Extract the gene IDs for the top ranking set
genes <- ___$___$Geneset.Peak.Genes[1]
# Split gene IDs into a vector
gene_ids <- strsplit(___, ', ')[[1]]
# Convert gene IDs to gene symbols
gene_symbol <- select(org.Hs.eg.db, keys=___, columns="___", keytype="___")
# Print the result
___(gene_symbol)