Joins mit fehlenden Werten
Zwei neue data.tables wurden in deine R-Session geladen: heart und cardio. Jede Tabelle enthält eine Menge an Mikroarray-Sonden, die du in zwei separaten Studien mit Herzkrankheiten in Verbindung gebracht hast*. Jede Sonde misst die Expressionslevel eines Gens. Jedes Gen kann von einer oder mehreren Sonden gemessen werden, und einige Sonden haben keine bekannte Genannotation in der Referenzsequenz des menschlichen Genoms. Die beiden Studien haben unterschiedliche Mikroarray-Plattformen verwendet, die jeweils andere Sonden zur Messung desselben Gens nutzen. Dein Ziel ist es herauszufinden, bei welchen Genen die Assoziationen mit Herzkrankheiten in beiden Studien reproduzierbar waren.
* Hinweis: Die Assoziationen sind zufällig generiert und repräsentieren keinen echten biologischen Befund oder realen Datensatz.
Diese Übung ist Teil des Kurses
Daten mit data.table in R verknüpfen
Anleitung zur Übung
- Führe mit der Funktion
merge()einen Inner Join voncardioaufheartaus und nutze dabei das passende Argument, um auftretende Fehler zu überschreiben. - Entferne in beiden
data.tablesdie Sonden ohne Genannotation (d. h. entferne Zeilen mit fehlenden Werten in der Spaltegene). - Wiederhole den Inner Join mit den neuen
data.tables, um einendata.tablemit reproduzierbaren Assoziationen zwischen Genen und Herzkrankheit zu erhalten.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Try an inner join
___
# Filter missing values
heart_2 <- ___
cardio_2 <- ___
# Inner join the filtered data.tables
___