Uso delle annotazioni
In questo esercizio userai le coordinate geniche ottenute dal pacchetto TxDb.Hsapiens.UCSC.hg19.knownGene. Questo pacchetto fornisce le coordinate di tutti i geni umani noti. Un oggetto GRanges con le coordinate e un ID univoco per i geni sul cromosoma 20 è stato caricato per te come human_genes.
Sebbene questi ID siano utili per identificare i geni, non sono immediati da interpretare. Può essere utile aggiungere anche i simboli genici, più facili da leggere per un umano. Questo si può ottenere con l'aiuto del pacchetto org.Hs.eg.db, che fornisce corrispondenze tra diversi insiemi di identificatori genici. La funzione select() consente di ottenere, per ogni ID, il simbolo del gene, memorizzato nella colonna SYMBOL. Una volta estratta questa informazione, puoi aggiungerla alla tabella delle posizioni geniche.
Questo esercizio fa parte del corso
ChIP-seq con Bioconductor in R
Istruzioni dell'esercizio
- Ottieni i simboli genici dalla colonna
SYMBOLdi org.Hs.eg.db. - Esamina la struttura delle annotazioni restituite.
- Aggiungi i simboli genici a
human_genes. - Esamina il risultato.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Obtain gene symbols
gene_symbol <- ___(org.Hs.eg.db, keys=human_genes$gene_id, columns="SYMBOL", keytype="ENTREZID")
# Examine the structure of the returned annotations
str(___)
# Add gene symbols to gene coordinates
human_genes$symbol <- ___
# Examine output
print(human_genes)