1. Nauka
  2. /
  3. Kursy
  4. /
  5. Łączenie danych z data.table w R

Connected

ćwiczenie

Złączenie z brakującymi wartościami

Do twojej sesji R zostały wczytane dwie nowe data.table: heart i cardio. Każda z nich zawiera zestaw sond mikromacierzowych, które w dwóch oddzielnych badaniach* okazały się być powiązane z chorobą serca. Każda sonda mierzy poziom ekspresji danego genu. Gen może być mierzony przez jedną lub więcej sond, a niektóre sondy nie mają żadnej przypisanej adnotacji genowej w referencyjnej sekwencji ludzkiego genomu. W obu badaniach zastosowano różne platformy mikromacierzowe, które używają różnych sond do pomiaru tych samych genów. Twoim celem jest znalezienie genów, których powiązania z chorobą serca potwierdziły się w obu badaniach.

* Uwaga: powiązania są generowane losowo i nie odzwierciedlają żadnych prawdziwych wyników biologicznych ani rzeczywistych zbiorów danych.

Instrukcje

100 XP
  • Używając funkcji merge(), wykonaj złączenie wewnętrzne (inner join) tabeli cardio z tabelą heart, podając odpowiedni argument, aby ominąć ewentualne błędy.
  • Usuń z obu data.table sondy bez adnotacji genowej (czyli wiersze z brakującymi wartościami w kolumnie gene).
  • Powtórz złączenie wewnętrzne na nowych data.table, aby uzyskać data.table zawierającą powtarzalne powiązania między genami a chorobą serca.