LoslegenKostenlos loslegen

Joins mit fehlenden Werten

Zwei neue data.tables wurden in deine R-Session geladen: heart und cardio. Jede Tabelle enthält eine Menge an Mikroarray-Sonden, die du in zwei separaten Studien mit Herzkrankheiten in Verbindung gebracht hast*. Jede Sonde misst die Expressionslevel eines Gens. Jedes Gen kann von einer oder mehreren Sonden gemessen werden, und einige Sonden haben keine bekannte Genannotation in der Referenzsequenz des menschlichen Genoms. Die beiden Studien haben unterschiedliche Mikroarray-Plattformen verwendet, die jeweils andere Sonden zur Messung desselben Gens nutzen. Dein Ziel ist es herauszufinden, bei welchen Genen die Assoziationen mit Herzkrankheiten in beiden Studien reproduzierbar waren.

* Hinweis: Die Assoziationen sind zufällig generiert und repräsentieren keinen echten biologischen Befund oder realen Datensatz.

Diese Übung ist Teil des Kurses

Daten mit data.table in R verknüpfen

Kurs anzeigen

Anleitung zur Übung

  • Führe mit der Funktion merge() einen Inner Join von cardio auf heart aus und nutze dabei das passende Argument, um auftretende Fehler zu überschreiben.
  • Entferne in beiden data.tables die Sonden ohne Genannotation (d. h. entferne Zeilen mit fehlenden Werten in der Spalte gene).
  • Wiederhole den Inner Join mit den neuen data.tables, um einen data.table mit reproduzierbaren Assoziationen zwischen Genen und Herzkrankheit zu erhalten.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Try an inner join
___

# Filter missing values
heart_2 <- ___
cardio_2 <- ___

# Inner join the filtered data.tables
___
Code bearbeiten und ausführen