Resultados da análise de DE
Depois de explorar o PCA e o mapa de calor de correlação, vimos um bom agrupamento das nossas amostras no PC1, que pareceu representar a variação nos dados devido à fibrose, e no PC2, que aparentou representar a variação nos dados devido à superexpressão de smoc2. Não encontramos fontes adicionais de variação nos dados nem outliers para remover. Portanto, podemos prosseguir executando o DESeq2, o teste de DE e reduzindo as mudanças de dobra (fold changes). Realizamos essas etapas para você e geramos os resultados finais, res_all.
Neste exercício, vamos filtrar os genes significativos dos resultados e exibir os 10 principais genes de DE pelo valor de p ajustado.
Este exercício faz parte do curso
RNA-Seq com Bioconductor em R
Instruções do exercício
Use a função
subset()para extrair os valores com valor de p ajustado menor que 0,05. Salve o subconjunto como um data frame chamadosmoc2_sigusando a funçãodata.frame()e transforme os nomes das linhas em uma coluna chamadageneIDcom a funçãorownames_to_column().Ordene os resultados significativos pelos valores de p ajustados usando a função
arrange(), selecione as colunas com o ID do gene Ensembl e os valores de p ajustados, e exiba os genes mais significativos usandohead().
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Select significant genese with padj < 0.05
smoc2_sig <- subset(___, ___) %>%
___() %>%
___(var = ___)
# Extract the top 6 genes with padj values
smoc2_sig %>%
___(___) %>%
select(___, ___) %>%
head()