1. 학습
  2. /
  3. 강의
  4. /
  5. R로 하는 Bioconductor 기반 RNA-Seq

Connected

연습 문제

메타데이터와 카운트 데이터 매칭

DESeq2로 분석을 수행하려면, 원시 카운트, 메타데이터, 설계 수식을 제공해 DESeq2 객체를 만들어야 합니다. 이를 위해 앞에서 생성한 원시 카운트 데이터와 연결된 메타데이터를 읽어오고, 두 데이터셋에서 샘플 이름의 순서가 동일한지 확인한 다음, 차등 발현 분석에 사용할 DESeq2 객체를 생성합니다. 조건(정상과 섬유화) 간 차등 발현을 검정하기 위해 설계 수식 ~ condition을 사용하겠습니다.

DESeq2와 dplyr 라이브러리는 미리 로드되어 있으며, smoc2_rawcounts와 smoc2_metadata 파일도 읽어온 상태입니다.

지침

100 XP
  • match() 함수를 사용해 메타데이터의 행 이름 순서에 맞추려면 카운트 데이터 열을 어떻게 재정렬해야 하는지에 대한 인덱스를 구하세요. 결과를 reorder_idx에 할당하세요.

  • 메타데이터의 행 이름 순서와 일치하도록 reorder_idx를 사용해 카운트 데이터의 열을 재정렬하세요.

  • 재정렬된 카운트와 메타데이터를 사용해 DESeqDataSetFromMatrix() 함수로 DESeq2 객체 dds_smoc2를 생성하세요.