1. Nauka
  2. /
  3. Kursy
  4. /
  5. ChIP-seq z Bioconductor w R

Connected

ćwiczenie

Dane sekwencjonowania

Podstawową jednostką zbioru danych ChIP-seq jest odczyt sekwencjonowania. Kompletny zbiór danych zazwyczaj zawiera kilka milionów odczytów przechowywanych w plikach BAM. W tym ćwiczeniu przyjrzymy się, jak odczyty są reprezentowane w R – na przykładzie odczytów z niewielkiego fragmentu chromosomu 20.

Odczyty zostały już wczytane do R. Są przechowywane w obiekcie GAlignments o nazwie reads. Obiekt GAlignments jest ściśle powiązany z GenomicRanges, który mógł pojawić się podczas wstępnych kursów dotyczących Bioconductor. To dobra okazja, by przypomnieć sobie, jak pracować z tym typem obiektu.

Pamiętaj, że Bioconductor udostępnia funkcje akcesorowe ułatwiające wyodrębnianie danych. Na przykład start() zwraca współrzędne początku wszystkich odczytów.

Instrukcje

100 XP
  • Wyświetl obiekt reads, aby uzyskać podsumowanie danych.
  • Pobierz pozycję startową pierwszego odczytu.
  • Pobierz pozycję końcową ostatniego odczytu.
  • Wyznacz liczbę odczytów pokrywających każdą pozycję w wybranym regionie, czyli oblicz pokrycie odczytów, korzystając z funkcji o tej samej nazwie.