1. Nauka
  2. /
  3. Kursy
  4. /
  5. Łączenie danych z data.table w R

Connected

ćwiczenie

Złączenia i filtrowanie duplikatów

Do twojej sesji R została wczytana kolejna data.table – framingham – zawierająca zestaw 35 genów i ich powiązań z chorobą serca, pochodzących z badania open access Joehanes R. i in., opublikowanego w 2013 roku. Twoim celem jest porównanie wyników tego badania z wynikami każdego z twoich badań. Do sesji R zostały wczytane data.tables cardio_2 i heart_2 – przefiltrowane pod kątem brakujących wartości, ale wciąż zawierające wiele sond dla każdego genu. Wczytana została również data.table z reprodukowalnymi powiązaniami, utworzona w poprzednim ćwiczeniu – reproducible.

Instrukcje

100 XP
  • Używając składni data.table, wykonaj right join tabeli framingham do heart_2, biorąc pierwszą sondę dla każdego genu w heart_2.
  • Wykonaj anti-join tabeli framingham do reproducible, aby sprawdzić, czy udało się znaleźć geny, które wcześniej nie były wiązane z chorobą serca.