1. 학습
  2. /
  3. 강의
  4. /
  5. R의 data.table로 데이터 결합하기

Connected

연습 문제

중복 조인 및 필터링

다른 data.table인 framingham이 R 세션에 로드되어 있습니다. 이 테이블에는 2013년에 발표된 Joehanes R. et al.의 공개 연구에서 심장병과의 연관성이 보고된 35개 유전자가 포함되어 있습니다. 목표는 이 연구의 결과를 각 연구의 결과와 비교하는 것입니다. 누락 값을 필터링했지만 여전히 유전자별로 여러 프로브가 남아 있는 cardio_2와 heart_2 data.table도 R 세션에 로드되어 있습니다. 이전 연습 문제에서 생성한 재현 가능한 연관성의 data.table인 reproducible도 R 세션에 로드되어 있습니다.

지침

100 XP
  • data.table 문법을 사용해, 각 유전자에 대해 heart_2에서 첫 번째 프로브만 취하도록 framingham을 heart_2에 right join 하세요.
  • 심장병과의 연관성이 이전에 보고되지 않은 유전자를 찾았는지 확인하기 위해, framingham을 reproducible에 대해 anti-join 하세요.