DESeq2-visualisaties - MA- en vulkaanplots
LET OP: Het kan iets langer duren voordat deze oefening is geladen.
Om de resultaten te verkennen, zijn visualisaties handig om zowel een globaal beeld van de data te krijgen als de kenmerken van de significante genen te bekijken. Meestal verwachten we significante genen over het hele bereik van gemiddelde waarden te zien, wat we kunnen plotten met de MA-plot. Als we alleen significante genen met hoge gemiddelde waarden zien, kan dat wijzen op een probleem met onze data. De vulkaanplot helpt je een idee te krijgen van het bereik aan fold changes dat nodig is om significantie in onze data te vinden.
Laten we onze resultaten verkennen met MA-plots en vulkaanplots.
Deze oefening maakt deel uit van de cursus
RNA-Seq met Bioconductor in R
Oefeninstructies
Maak een MA-plot met de functie
plotMA()en gebruik het results-objectsmoc2_resals input.Maak een nieuwe kolom als een logische vector die aangeeft of
padj-waarden kleiner zijn dan 0,05 voor de resultaten met behulp van de functiemutate().Maak een vulkaanplot van de log2-foldchangewaarden tegenover de -log10 aangepaste p-waarde met
ggplot()en kleur de punten voor de genen op basis van of ze significant zijn of niet.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create MA plot
___
# Generate logical column
smoc2_res_all <- data.frame(smoc2_res) %>% mutate(threshold = padj < 0.05)
# Create the volcano plot
ggplot(___) +
geom_point(aes(x = ___, y = -log10(___), color = ___)) +
xlab("log2 fold change") +
ylab("-log10 adjusted p-value") +
theme(legend.position = "none",
plot.title = element_text(size = rel(1.5), hjust = 0.5),
axis.title = element_text(size = rel(1.25)))