1. 학습
  2. /
  3. 강의
  4. /
  5. R로 하는 Bioconductor 기반 RNA-Seq

Connected

연습 문제

DE 분석 결과

PCA와 상관 행렬 히트맵을 살펴본 결과, PC1에서는 섬유증(fibrosis)에 의한 변이를, PC2에서는 smoc2 과발현에 의한 변이를 잘 구분하는 클러스터링이 확인되었어요. 추가적인 변이 요인이나 제거해야 할 이상치는 발견되지 않았습니다. 따라서 DESeq2 실행, DE 검정, 폴드 변화 축소(shrinking)를 진행할 수 있었고, 최종 결과 res_all을 만들어 두었습니다.

이번 연습 문제에서는 결과에서 유의한 유전자만 부분집합으로 추출하고, 보정 p-값이 가장 낮은 상위 10개의 DE 유전자를 출력해 볼 거예요.

지침

100 XP
  • subset() 함수를 사용해 보정 p-값이 0.05보다 작은 값만 추출하세요. data.frame() 함수로 데이터 프레임으로 변환하고, rownames_to_column() 함수로 행 이름을 geneID라는 열로 바꿔서 smoc2_sig라는 데이터 프레임으로 저장하세요.

  • arrange() 함수로 보정 p-값 기준으로 유의한 결과를 정렬하고, Ensembl 유전자 ID와 보정 p-값 열만 select()로 선택한 뒤, head()로 상위 유의한 유전자를 출력하세요.