Resultados del análisis DE
Tras explorar el PCA y el mapa de calor de correlaciones, vimos una buena agrupación de las muestras en el PC1, que parecía representar la variación en los datos debida a la fibrosis, y en el PC2, que parecía representar la variación debida a la sobreexpresión de smoc2. No detectamos fuentes adicionales de variación en los datos ni valores atípicos que eliminar. Por tanto, podemos continuar ejecutando DESeq2, las pruebas de DE y el ajuste de los cambios en el fold change. Realizamos estos pasos por ti para generar los resultados finales, res_all.
En este ejercicio, vamos a extraer los genes significativos de los resultados y a mostrar los 10 genes con DE más destacados según el valor p ajustado.
Este ejercicio forma parte del curso
RNA-Seq con Bioconductor en R
Instrucciones del ejercicio
Usa la función
subset()para extraer aquellos valores con un valor p ajustado menor que 0.05. Guarda el subconjunto como un data frame llamadosmoc2_sigutilizando la funcióndata.frame()y pasa los nombres de fila a una columna llamadageneIDcon la funciónrownames_to_column().Ordena los resultados significativos por los valores p ajustados usando la función
arrange(), selecciona las columnas con el identificador de gen de Ensembl y los valores p ajustados, y muestra los genes más significativos usandohead().
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Select significant genese with padj < 0.05
smoc2_sig <- subset(___, ___) %>%
___() %>%
___(var = ___)
# Extract the top 6 genes with padj values
smoc2_sig %>%
___(___) %>%
select(___, ___) %>%
head()