1. 학습
  2. /
  3. 강의
  4. /
  5. R에서 Bioconductor로 배우는 ChIP-seq

Connected

연습 문제

시퀀싱 데이터

ChIP-seq 데이터셋의 기본 단위는 시퀀싱 리드예요. 전체 데이터셋은 보통 수백만 개의 리드로 이루어지며, BAM 파일에 저장됩니다. 이 연습 문제에서는 염색체 20의 작은 구간에서 나온 리드를 사용하여 R에서 리드가 어떻게 표현되는지 살펴보겠습니다.

리드는 이미 R에 불러와 두었습니다. reads라는 이름의 GAlignments 객체에 저장되어 있어요. GAlignments 객체는 입문용 Bioconductor 강의에서 보셨을 수도 있는 GenomicRanges와 밀접하게 관련되어 있습니다. 이 기회에 이런 유형의 객체와 상호작용하는 방법을 다시 떠올려 보세요.

Bioconductor는 데이터를 더 쉽게 추출할 수 있도록 접근자 함수를 제공한다는 점을 기억하세요. 예를 들어, start()는 모든 리드의 시작 좌표를 추출합니다.

지침

100 XP
  • 데이터 요약을 확인하려면 reads 객체를 출력하세요.
  • 첫 번째 리드의 시작 위치를 가져오세요.
  • 마지막 리드의 끝 위치를 가져오세요.
  • 선택한 구간의 각 위치를 덮는 리드의 수를 확인하세요. 즉, 같은 이름의 함수를 사용해 리드의 커버리지(coverage)를 계산하세요.