Joindre et filtrer les doublons
Un autre data.table, framingham, a été chargé dans votre session R. Il contient un ensemble de 35 gènes et leurs associations avec les maladies cardiaques issues d’une étude en libre accès par Joehanes R. et al. publiée en 2013. Votre objectif est de comparer les résultats de cette étude à ceux de chacune de vos études. Les data.table cardio_2 et heart_2, filtrés pour les valeurs manquantes mais contenant encore plusieurs sondes par gène, ont été chargés dans votre session R. Le data.table des associations reproductibles que vous avez créé dans le dernier exercice, reproducible, a également été chargé dans votre session R.
Cet exercice fait partie du cours
Combiner des données avec data.table en R
Instructions
- En utilisant la syntaxe
data.table, faites une jointure droite deframinghamavecheart_2, en prenant la première sonde pour chaque gène dansheart_2. - Réalisez une anti-jointure de
framinghamavecreproduciblepour voir si vous avez trouvé des gènes qui n’avaient pas encore été associés aux maladies cardiaques.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Right join taking the first match
___
# Anti-join
___