DE-Analyse
HINWEIS: Das Laden dieser Übung kann etwas länger dauern.
Wir arbeiten weiterhin mit dem vollständigen Datensatz und vergleichen die Gene, die signifikante Expressionsunterschiede zwischen normalen und Fibrose-Proben aufweisen, unabhängig vom Genotyp (design: ~ genotype + condition). Daher verwenden wir das in der vorherigen Übung erstellte DESeq2-Objekt dds_all. Gehe davon aus, dass dieses Objekt erstellt wurde und alle Bibliotheken geladen sind. In dieser Übung führen wir unüberwachte Clustering-Analysen durch, um die Clusterbildung unserer Proben und Quellen der Variation zu untersuchen.
Diese Übung ist Teil des Kurses
RNA-Seq mit Bioconductor in R
Anleitung zur Übung
Wandle die normalisierten Counts im Objekt
dds_allmit der Funktionvst()logarithmisch, ohne Informationen zu den Probengruppen zu berücksichtigen (blind).Erstelle eine Korrelations-Heatmap der Korrelationswerte der logarithmisch normalisierten Counts mit
pheatmap(). Füge Annotationsleisten fürgenotypeundconditionhinzu.Zeichne die PCA mit
plotPCA()unter Verwendung vonvsd_all. Färbe den Plot nachcondition.Zeichne die PCA mit
plotPCA()unter Verwendung vonvsd_all. Färbe den Plot nachgenotype.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Log transform counts for QC
vsd_all <- ___(___, blind = ___)
# Create heatmap of sample correlation values
vsd_all %>%
___() %>%
___() %>%
___(annotation = select(all_metadata, c("___", "___")))
# Create the PCA plot for PC1 and PC2 and color by condition
___(___, ___ = ___)
# Create the PCA plot for PC1 and PC2 and color by genotype
___(___, ___ = ___)