Dane sekwencjonowania

Podstawową jednostką zbioru danych ChIP-seq jest odczyt sekwencjonowania. Kompletny zbiór danych zazwyczaj zawiera kilka milionów odczytów przechowywanych w plikach BAM. W tym ćwiczeniu przyjrzymy się, jak odczyty są reprezentowane w R – na przykładzie odczytów z niewielkiego fragmentu chromosomu 20.

Odczyty zostały już wczytane do R. Są przechowywane w obiekcie GAlignments o nazwie reads. Obiekt GAlignments jest ściśle powiązany z GenomicRanges, który mógł pojawić się podczas wstępnych kursów dotyczących Bioconductor. To dobra okazja, by przypomnieć sobie, jak pracować z tym typem obiektu.

Pamiętaj, że Bioconductor udostępnia funkcje akcesorowe ułatwiające wyodrębnianie danych. Na przykład start() zwraca współrzędne początku wszystkich odczytów.

Wyświetl obiekt reads, aby uzyskać podsumowanie danych.
Pobierz pozycję startową pierwszego odczytu.
Pobierz pozycję końcową ostatniego odczytu.
Wyznacz liczbę odczytów pokrywających każdą pozycję w wybranym regionie, czyli oblicz pokrycie odczytów, korzystając z funkcji o tej samej nazwie.

ćwiczenie

Dane sekwencjonowania

Instrukcje

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}ćwiczenie

Instrukcje

ćwiczenie