ComeçarComece de graça

Resultados da análise de DE

Depois de explorar o PCA e o mapa de calor de correlação, vimos um bom agrupamento das nossas amostras no PC1, que pareceu representar a variação nos dados devido à fibrose, e no PC2, que aparentou representar a variação nos dados devido à superexpressão de smoc2. Não encontramos fontes adicionais de variação nos dados nem outliers para remover. Portanto, podemos prosseguir executando o DESeq2, o teste de DE e reduzindo as mudanças de dobra (fold changes). Realizamos essas etapas para você e geramos os resultados finais, res_all.

Neste exercício, vamos filtrar os genes significativos dos resultados e exibir os 10 principais genes de DE pelo valor de p ajustado.

Este exercício faz parte do curso

RNA-Seq com Bioconductor em R

Ver curso

Instruções do exercício

  • Use a função subset() para extrair os valores com valor de p ajustado menor que 0,05. Salve o subconjunto como um data frame chamado smoc2_sig usando a função data.frame() e transforme os nomes das linhas em uma coluna chamada geneID com a função rownames_to_column().

  • Ordene os resultados significativos pelos valores de p ajustados usando a função arrange(), selecione as colunas com o ID do gene Ensembl e os valores de p ajustados, e exiba os genes mais significativos usando head().

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Select significant genese with padj < 0.05
smoc2_sig <- subset(___, ___) %>%
  				___() %>%
  				___(var = ___)

# Extract the top 6 genes with padj values
smoc2_sig %>%
	___(___) %>%
	select(___, ___) %>%
	head()
Editar e executar o código