Duplikate verbinden und filtern
Eine weitere data.table wurde in deine R-Session geladen: framingham. Sie enthält eine Auswahl von 35 Genen und deren Zusammenhang mit Herzerkrankungen aus einer Open-Access-Studie von Joehanes R. et al., veröffentlicht 2013. Dein Ziel ist es, die Ergebnisse dieser Studie mit den Ergebnissen aus deinen Studien zu vergleichen. Die data.tables cardio_2 und heart_2, bereits auf fehlende Werte gefiltert, aber weiterhin mit mehreren Probes pro Gen, wurden in deine R-Session geladen. Die data.table der reproduzierbaren Zusammenhänge, die du in der letzten Übung erstellt hast, reproducible, wurde ebenfalls geladen.
Diese Übung ist Teil des Kurses
Daten mit data.table in R verknüpfen
Anleitung zur Übung
- Verwende die
data.table-Syntax und führe einen Right-Join vonframinghamaufheart_2durch, wobei du die erste Probe pro Gen inheart_2nimmst. - Führe einen Anti-Join von
framinghamaufreproducibleaus, um zu prüfen, ob du Gene gefunden hast, die bisher nicht mit Herzerkrankungen in Verbindung gebracht wurden.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Right join taking the first match
___
# Anti-join
___