LoslegenKostenlos loslegen

DE-Analyseergebnisse

Nach der Untersuchung der PCA und der Korrelations-Heatmap haben wir eine gute Clusterbildung unserer Proben auf PC1 gefunden, der offenbar die durch Fibrose bedingte Variation in den Daten repräsentiert, und auf PC2, der die Variation durch smoc2-Überexpression abzubilden scheint. Wir haben keine weiteren Variationsquellen oder Ausreißer gefunden, die entfernt werden müssten. Daher können wir mit DESeq2, dem DE-Test und dem Shrinken der Fold Changes fortfahren. Diese Schritte haben wir für dich ausgeführt, um die finalen Ergebnisse res_all zu erzeugen.

In dieser Übung wollen wir die signifikanten Gene aus den Ergebnissen auswählen und die Top 10 DE-Gene nach adjustiertem p-Wert ausgeben.

Diese Übung ist Teil des Kurses

RNA-Seq mit Bioconductor in R

Kurs anzeigen

Anleitung zur Übung

  • Verwende die Funktion subset(), um die Werte mit einem adjustierten p-Wert kleiner als 0,05 zu extrahieren. Speichere die Teilmenge als Data Frame mit dem Namen smoc2_sig, indem du data.frame() verwendest und die Zeilennamen mit rownames_to_column() in eine Spalte namens geneID umwandelst.

  • Sortiere die signifikanten Ergebnisse nach adjustierten p-Werten mit arrange(), wähle die Spalten mit Ensembl-Gene-ID und adjustierten p-Werten aus, und gib die am stärksten signifikanten Gene mit head() aus.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Select significant genese with padj < 0.05
smoc2_sig <- subset(___, ___) %>%
  				___() %>%
  				___(var = ___)

# Extract the top 6 genes with padj values
smoc2_sig %>%
	___(___) %>%
	select(___, ___) %>%
	head()
Code bearbeiten und ausführen