Metadaten und Count-Daten abgleichen
Um Analysen mit DESeq2 durchzuführen, müssen wir ein DESeq2-Objekt erstellen, indem wir Roh-Counts, Metadaten und die Design-Formel angeben. Dazu lesen wir die zuvor erstellten Roh-Count-Daten und zugehörigen Metadaten ein, stellen sicher, dass die Probennamen in beiden Datensätzen in der gleichen Reihenfolge sind, und erstellen dann ein DESeq2-Objekt für die Differential-Expressions-Analyse. Wir verwenden die Design-Formel ~ condition, um auf Differentialexpression zwischen den Bedingungen (normal und Fibrose) zu testen.
Die Bibliotheken DESeq2 und dplyr wurden für dich geladen, und die Dateien smoc2_rawcounts und smoc2_metadata wurden eingelesen.
Diese Übung ist Teil des Kurses
RNA-Seq mit Bioconductor in R
Anleitung zur Übung
Verwende die Funktion
match(), um die Indizes zu erhalten, wie die Spalten der Count-Daten umsortiert werden müssen, damit sie der Reihenfolge der Zeilennamen der Metadaten entsprechen. Weise das Ergebnisreorder_idxzu.Sortiere die Spalten der Count-Daten mit
reorder_idxso um, dass die Spaltennamen der Reihenfolge der Zeilennamen in den Metadaten entsprechen.Erstelle ein DESeq2-Objekt
dds_smoc2mit der FunktionDESeqDataSetFromMatrix()unter Verwendung der Metadaten und der umsortierten Counts.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Use the match() function to reorder the columns of the raw counts
reorder_idx <- match(___(___), ___(___))
# Reorder the columns of the count data
reordered_smoc2_rawcounts <- smoc2_rawcounts[ , ___]
# Create a DESeq2 object
dds_smoc2 <- DESeqDataSetFromMatrix(countData = ___,
colData = ___,
design = ~ condition)