IniziaInizia gratis

Uso delle annotazioni

In questo esercizio userai le coordinate geniche ottenute dal pacchetto TxDb.Hsapiens.UCSC.hg19.knownGene. Questo pacchetto fornisce le coordinate di tutti i geni umani noti. Un oggetto GRanges con le coordinate e un ID univoco per i geni sul cromosoma 20 è stato caricato per te come human_genes.

Sebbene questi ID siano utili per identificare i geni, non sono immediati da interpretare. Può essere utile aggiungere anche i simboli genici, più facili da leggere per un umano. Questo si può ottenere con l'aiuto del pacchetto org.Hs.eg.db, che fornisce corrispondenze tra diversi insiemi di identificatori genici. La funzione select() consente di ottenere, per ogni ID, il simbolo del gene, memorizzato nella colonna SYMBOL. Una volta estratta questa informazione, puoi aggiungerla alla tabella delle posizioni geniche.

Questo esercizio fa parte del corso

ChIP-seq con Bioconductor in R

Visualizza il corso

Istruzioni dell'esercizio

  • Ottieni i simboli genici dalla colonna SYMBOL di org.Hs.eg.db.
  • Esamina la struttura delle annotazioni restituite.
  • Aggiungi i simboli genici a human_genes.
  • Esamina il risultato.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Obtain gene symbols
gene_symbol <- ___(org.Hs.eg.db, keys=human_genes$gene_id, columns="SYMBOL", keytype="ENTREZID")

# Examine the structure of the returned annotations
str(___)

# Add gene symbols to gene coordinates
human_genes$symbol <- ___

# Examine output
print(human_genes)
Modifica ed esegui il codice