1. Learn
  2. /
  3. Courses
  4. /
  5. R의 data.table로 데이터 결합하기

Connected

Exercise

결측값이 있는 경우 조인하기

두 개의 새로운 data.table이 R 세션에 로드되어 있어요: heart와 cardio예요. 각각은 두 개의 별도 연구에서 심장 질환과 연관된 것으로 확인된 마이크로어레이 프로브 집합을 담고 있어요*. 각 프로브는 유전자의 발현 수준을 측정해요. 각 유전자는 하나 이상의 프로브로 측정될 수 있으며, 일부 프로브는 인간 게놈 참조 서열에서 알려진 유전자 주석이 없을 수 있어요. 두 연구는 서로 다른 마이크로어레이 플랫폼을 사용했으며, 각 플랫폼은 각 유전자를 측정하는 데 서로 다른 프로브를 사용했어요. 목표는 두 연구 모두에서 심장 질환과의 연관성이 재현된 유전자가 무엇인지 찾는 거예요.

* 참고: 연관성은 무작위로 생성되었으며, 실제 생물학적 발견이나 실제 데이터셋을 대표하지 않아요.

Instructions

100 XP
  • merge() 함수를 사용해 cardio를 heart에 내부 조인하세요. 이때 발생할 수 있는 오류를 무시하고 진행하도록 적절한 인수를 지정하세요.
  • 두 data.table 모두에서 유전자 주석이 없는 프로브를 제거하세요(즉, gene 열의 결측값이 있는 행을 제거하세요).
  • 정리된 data.table들을 사용해 내부 조인을 다시 수행해, 유전자와 심장 질환 사이의 재현 가능한 연관성만 담은 data.table을 얻으세요.