Sekanslama verisi

Bir ChIP-seq veri kümesinin temel birimi, bir sekanslama okumasıdır. Tam bir veri kümesi genellikle BAM dosyalarında saklanan birkaç milyon okumadan oluşur. Bu egzersizde, kromozom 20 üzerindeki küçük bir bölgeden gelen okumaları kullanarak, okumaların R'de nasıl temsil edildiğine bakacağız.

Okumalar senin için zaten R'a yüklendi. reads adlı bir GAlignments nesnesinde saklanıyorlar. GAlignments nesnesi, giriş niteliğindeki Bioconductor kurslarında karşılaşmış olabileceğin GenomicRanges ile yakından ilişkilidir. Bu, bu tür bir nesneyle nasıl etkileşime gireceğini kendine hatırlatmak için iyi bir fırsat.

Bioconductor'ın veriyi çıkarmayı kolaylaştıran erişim (accessor) fonksiyonları sağladığını unutma. Örneğin, start() tüm okumaların başlangıç koordinatlarını çıkarır.

Bu egzersiz, kursun bir parçasıdır

R ile Bioconductor kullanarak ChIP-seq

Kursa Göz Atın

Egzersiz talimatları

Verinin özetini almak için reads nesnesini yazdır.
İlk okumanın başlangıç konumunu al.
Son okumanın bitiş konumunu al.
Seçilen bölgedeki her konumu kaç okumanın kapladığını belirle, yani aynı adlı fonksiyonu kullanarak okuma kapsamasını (coverage) hesapla.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Print the 'reads' object to obtain a summary of the data
print(___)

# Get the *start* position of the first read
start_first <- ___(reads)[1]

# Get the *end* position of the last read
end_last <- ___(___)[length(___)]

# Compute the number of reads covering each position in the selected region
cvg <- ___

Kodu Düzenle ve Çalıştır