Menggunakan Anotasi
Dalam latihan ini, Anda akan menggunakan koordinat gen yang diperoleh dari paket TxDb.Hsapiens.UCSC.hg19.knownGene. Paket ini menyediakan koordinat semua gen manusia yang telah diketahui. Sebuah objek GRanges berisi koordinat dan ID unik untuk gen pada kromosom 20 telah dimuat untuk Anda sebagai human_genes.
Meskipun ID ini berguna untuk mengidentifikasi gen, ID tersebut tidak mudah dipahami. Akan lebih baik untuk menambahkan simbol gen yang lebih mudah dibaca manusia. Ini dapat dilakukan dengan bantuan paket org.Hs.eg.db, yang menyediakan pemetaan antara berbagai himpunan pengidentifikasi gen. Fungsi select() memungkinkan Anda memperoleh simbol gen, yang disimpan di kolom SYMBOL, untuk setiap ID. Setelah Anda mengekstrak informasi ini, Anda dapat menambahkannya ke tabel lokasi gen.
Latihan ini adalah bagian dari kursus
ChIP-seq dengan Bioconductor di R
Petunjuk latihan
- Ambil simbol gen dari kolom
SYMBOLmilik org.Hs.eg.db. - Periksa struktur anotasi yang dikembalikan.
- Tambahkan simbol gen ke
human_genes. - Periksa hasilnya.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Obtain gene symbols
gene_symbol <- ___(org.Hs.eg.db, keys=human_genes$gene_id, columns="SYMBOL", keytype="ENTREZID")
# Examine the structure of the returned annotations
str(___)
# Add gene symbols to gene coordinates
human_genes$symbol <- ___
# Examine output
print(human_genes)