DE-Analyseergebnisse
Nach der Untersuchung der PCA und der Korrelations-Heatmap haben wir eine gute Clusterbildung unserer Proben auf PC1 gefunden, der offenbar die durch Fibrose bedingte Variation in den Daten repräsentiert, und auf PC2, der die Variation durch smoc2-Überexpression abzubilden scheint. Wir haben keine weiteren Variationsquellen oder Ausreißer gefunden, die entfernt werden müssten. Daher können wir mit DESeq2, dem DE-Test und dem Shrinken der Fold Changes fortfahren. Diese Schritte haben wir für dich ausgeführt, um die finalen Ergebnisse res_all zu erzeugen.
In dieser Übung wollen wir die signifikanten Gene aus den Ergebnissen auswählen und die Top 10 DE-Gene nach adjustiertem p-Wert ausgeben.
Diese Übung ist Teil des Kurses
RNA-Seq mit Bioconductor in R
Anleitung zur Übung
Verwende die Funktion
subset(), um die Werte mit einem adjustierten p-Wert kleiner als 0,05 zu extrahieren. Speichere die Teilmenge als Data Frame mit dem Namensmoc2_sig, indem dudata.frame()verwendest und die Zeilennamen mitrownames_to_column()in eine Spalte namensgeneIDumwandelst.Sortiere die signifikanten Ergebnisse nach adjustierten p-Werten mit
arrange(), wähle die Spalten mit Ensembl-Gene-ID und adjustierten p-Werten aus, und gib die am stärksten signifikanten Gene mithead()aus.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Select significant genese with padj < 0.05
smoc2_sig <- subset(___, ___) %>%
___() %>%
___(var = ___)
# Extract the top 6 genes with padj values
smoc2_sig %>%
___(___) %>%
select(___, ___) %>%
head()