CommencerCommencer gratuitement

Joindre et filtrer les doublons

Un autre data.table, framingham, a été chargé dans votre session R. Il contient un ensemble de 35 gènes et leurs associations avec les maladies cardiaques issues d’une étude en libre accès par Joehanes R. et al. publiée en 2013. Votre objectif est de comparer les résultats de cette étude à ceux de chacune de vos études. Les data.table cardio_2 et heart_2, filtrés pour les valeurs manquantes mais contenant encore plusieurs sondes par gène, ont été chargés dans votre session R. Le data.table des associations reproductibles que vous avez créé dans le dernier exercice, reproducible, a également été chargé dans votre session R.

Cet exercice fait partie du cours

Combiner des données avec data.table en R

Afficher le cours

Instructions

  • En utilisant la syntaxe data.table, faites une jointure droite de framingham avec heart_2, en prenant la première sonde pour chaque gène dans heart_2.
  • Réalisez une anti-jointure de framingham avec reproducible pour voir si vous avez trouvé des gènes qui n’avaient pas encore été associés aux maladies cardiaques.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Right join taking the first match
___

# Anti-join
___
Modifier et exécuter le code