Duplikate verbinden und filtern
Eine weitere data.table wurde in deine R-Session geladen: framingham. Sie enthält eine Auswahl von 35 Genen und deren Zusammenhang mit Herzerkrankungen aus einer Open-Access-Studie von Joehanes R. et al., veröffentlicht 2013. Dein Ziel ist es, die Ergebnisse dieser Studie mit den Ergebnissen aus deinen Studien zu vergleichen. Die data.tables cardio_2 und heart_2, bereits auf fehlende Werte gefiltert, aber weiterhin mit mehreren Probes pro Gen, wurden in deine R-Session geladen. Die data.table der reproduzierbaren Zusammenhänge, die du in der letzten Übung erstellt hast, reproducible, wurde ebenfalls geladen.
Diese Übung ist Teil des Kurses
<Kurs>Daten mit data.table in R verknüpfen</Kurs>Übungsanweisungen
- Verwende die
data.table-Syntax und führe einen Right-Join vonframinghamaufheart_2durch, wobei du die erste Probe pro Gen inheart_2nimmst. - Führe einen Anti-Join von
framinghamaufreproducibleaus, um zu prüfen, ob du Gene gefunden hast, die bisher nicht mit Herzerkrankungen in Verbindung gebracht wurden.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Right join taking the first match
___
# Anti-join
___