1. 学ぶ
  2. /
  3. コース
  4. /
  5. R で学ぶ data.table によるデータ結合

Connected

演習

欠損値を含む結合

R セッションには新しい data.table が 2 つ、heart と cardio が読み込まれています。どちらも、2 つの別々の研究で心疾患と関連づけられた一連のマイクロアレイプローブを含みます。各プローブは遺伝子の発現量を測定します。1 つの遺伝子は 1 本以上のプローブで測定されることがあり、既知の遺伝子アノテーションがヒトゲノム参照配列に存在しないプローブもあります。2 つの研究では、各遺伝子を測定するために異なるプローブを用いる別々のマイクロアレイプラットフォームが使われています。あなたの目標は、両方の研究で心疾患との関連が再現された遺伝子を見つけることです。

* 注: ここでの関連はランダムに生成されたもので、実在の生物学的知見や実データを反映するものではありません。

指示

100 XP
  • merge() 関数を使い、適切な引数でエラーを回避しながら cardio を heart に対して内部結合してください。
  • 両方の data.table から遺伝子アノテーションのないプローブ(つまり、gene 列が欠損している行)を削除します。
  • 新しい data.table 同士で内部結合をもう一度実行し、遺伝子と心疾患の間で再現性のある関連の data.table を得てください。