Menggunakan Anotasi
Dalam latihan ini, Anda akan menggunakan koordinat gen yang diperoleh dari paket TxDb.Hsapiens.UCSC.hg19.knownGene. Paket ini menyediakan koordinat semua gen manusia yang telah diketahui. Sebuah objek GRanges berisi koordinat dan ID unik untuk gen pada kromosom 20 telah dimuat untuk Anda sebagai human_genes.
Meskipun ID ini berguna untuk mengidentifikasi gen, ID tersebut tidak mudah dipahami. Akan lebih baik untuk menambahkan simbol gen yang lebih mudah dibaca manusia. Ini dapat dilakukan dengan bantuan paket org.Hs.eg.db, yang menyediakan pemetaan antara berbagai himpunan pengidentifikasi gen. Fungsi select() memungkinkan Anda memperoleh simbol gen, yang disimpan di kolom SYMBOL, untuk setiap ID. Setelah Anda mengekstrak informasi ini, Anda dapat menambahkannya ke tabel lokasi gen.
Latihan ini merupakan bagian dari kursus
ChIP-seq dengan Bioconductor di R
Instruksi latihan
- Ambil simbol gen dari kolom
SYMBOLmilik org.Hs.eg.db. - Periksa struktur anotasi yang dikembalikan.
- Tambahkan simbol gen ke
human_genes. - Periksa hasilnya.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Obtain gene symbols
gene_symbol <- ___(org.Hs.eg.db, keys=human_genes$gene_id, columns="SYMBOL", keytype="ENTREZID")
# Examine the structure of the returned annotations
str(___)
# Add gene symbols to gene coordinates
human_genes$symbol <- ___
# Examine output
print(human_genes)