BaşlayınÜcretsiz Başlayın

Sekanslama verisi

Bir ChIP-seq veri kümesinin temel birimi, bir sekanslama okumasıdır. Tam bir veri kümesi genellikle BAM dosyalarında saklanan birkaç milyon okumadan oluşur. Bu egzersizde, kromozom 20 üzerindeki küçük bir bölgeden gelen okumaları kullanarak, okumaların R'de nasıl temsil edildiğine bakacağız.

Okumalar senin için zaten R'a yüklendi. reads adlı bir GAlignments nesnesinde saklanıyorlar. GAlignments nesnesi, giriş niteliğindeki Bioconductor kurslarında karşılaşmış olabileceğin GenomicRanges ile yakından ilişkilidir. Bu, bu tür bir nesneyle nasıl etkileşime gireceğini kendine hatırlatmak için iyi bir fırsat.

Bioconductor'ın veriyi çıkarmayı kolaylaştıran erişim (accessor) fonksiyonları sağladığını unutma. Örneğin, start() tüm okumaların başlangıç koordinatlarını çıkarır.

Bu egzersiz

R ile Bioconductor kullanarak ChIP-seq

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • Verinin özetini almak için reads nesnesini yazdır.
  • İlk okumanın başlangıç konumunu al.
  • Son okumanın bitiş konumunu al.
  • Seçilen bölgedeki her konumu kaç okumanın kapladığını belirle, yani aynı adlı fonksiyonu kullanarak okuma kapsamasını (coverage) hesapla.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Print the 'reads' object to obtain a summary of the data
print(___)

# Get the *start* position of the first read
start_first <- ___(reads)[1]

# Get the *end* position of the last read
end_last <- ___(___)[length(___)]

# Compute the number of reads covering each position in the selected region
cvg <- ___
Kodu Düzenle ve Çalıştır