1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Joining Data with data.table in R

Connected

cvičení

Join s chybějícími hodnotami

Do tvého R sezení byly načteny dvě nové data.table: heart a cardio. Každá obsahuje sadu mikročipových sond, které jsi v rámci dvou samostatných studií identifikoval/a jako asociované se srdečním onemocněním*. Každá sonda měří úroveň exprese určitého genu. Gen může být měřen jednou nebo více sondami a některé sondy nemají žádnou známou genovou anotaci v referenční sekvenci lidského genomu. Obě studie využívaly různé mikročipové platformy s odlišnými sondami pro měření jednotlivých genů. Tvým cílem je zjistit, které geny vykazovaly reprodukovatelné asociace se srdečním onemocněním v obou studiích.

* Poznámka: asociace jsou generovány náhodně a nepředstavují žádný skutečný biologický nález ani reálný dataset.

Pokyny

100 XP
  • Pomocí funkce merge() proveď inner join tabulky cardio k tabulce heart s odpovídajícím argumentem, který potlačí případné chyby.
  • Z obou data.table odstraň sondy bez genové anotace (tj. řádky s chybějícími hodnotami ve sloupci gene).
  • Zopakuj inner join s novými data.table a získej data.table reprodukovatelných asociací mezi geny a srdečním onemocněním.