1. Учиться
  2. /
  3. Courses
  4. /
  5. R에서 Bioconductor로 배우는 ChIP-seq

Connected

Exercise

BAM 파일 읽기

먼저 BAM 파일에서 매핑된 리드를 R로 읽어 오겠습니다. 이 파일은 리드 서열과 기준 유전체 간의 정렬 정보를 압축된 이진 형식으로 저장합니다. BAM 파일에서 데이터를 불러오는 일은 유전체 데이터 분석에서 매우 흔한 작업이에요.

이번 연습에서는 먼저 BAM 파일에서 모든 리드를 불러옵니다. 방법은 간단하지만 메모리를 많이 사용할 수 있어요. 그래서 두 번째 단계에서는 관심 있는 영역의 리드만 선택적으로 불러오는 방법을 배웁니다.

Инструкции

100 XP
  • readGAlignments() 함수를 사용해 chr20_bam 파일에서 리드를 불러오세요.
  • 20번 염색체의 29805000 - 29820000 구간을 포함하도록 chr20_bam에 대한 BamViews 객체를 만드세요.
  • readGAlignments()를 다시 사용해 해당 뷰에 포함된 리드만 불러오세요.
  • str()로 reads_sub 객체를 살펴보세요.