Açıklamaları (Annotasyonları) Kullanma
Bu egzersizde, TxDb.Hsapiens.UCSC.hg19.knownGene paketinden elde edilen gen koordinatlarını kullanacaksın. Bu paket, bilinen tüm insan genlerinin koordinatlarını sağlar. Kromozom 20 üzerindeki genler için koordinatlar ve benzersiz bir ID içeren bir GRanges nesnesi senin için human_genes olarak yüklendi.
Bu ID'ler genleri tanımlamak için kullanışlı olsa da, anlamlandırması kolay değildir. Daha okunabilir gen sembollerini de eklemek faydalı olabilir. Bunu, farklı gen tanımlayıcı kümeleri arasında eşleştirmeler sağlayan org.Hs.eg.db paketinin yardımıyla yapabilirsin. select() fonksiyonu, her ID için SYMBOL sütununda saklanan gen sembolünü almanı sağlar. Bu bilgiyi çıkardıktan sonra, gen konumları tablosuna ekleyebilirsin.
Bu egzersiz
R ile Bioconductor kullanarak ChIP-seq
kursunun bir parçasıdırEgzersiz talimatları
- org.Hs.eg.db içindeki
SYMBOLsütunundan gen sembollerini elde et. - Dönen açıklamaların (annotasyonların) yapısını incele.
- Gen sembollerini
human_genesnesnesine ekle. - Sonucu incele.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Obtain gene symbols
gene_symbol <- ___(org.Hs.eg.db, keys=human_genes$gene_id, columns="SYMBOL", keytype="ENTREZID")
# Examine the structure of the returned annotations
str(___)
# Add gene symbols to gene coordinates
human_genes$symbol <- ___
# Examine output
print(human_genes)