ComenzarEmpieza gratis

Resultados del análisis DE

Tras explorar el PCA y el mapa de calor de correlaciones, vimos una buena agrupación de las muestras en el PC1, que parecía representar la variación en los datos debida a la fibrosis, y en el PC2, que parecía representar la variación debida a la sobreexpresión de smoc2. No detectamos fuentes adicionales de variación en los datos ni valores atípicos que eliminar. Por tanto, podemos continuar ejecutando DESeq2, las pruebas de DE y el ajuste de los cambios en el fold change. Realizamos estos pasos por ti para generar los resultados finales, res_all.

En este ejercicio, vamos a extraer los genes significativos de los resultados y a mostrar los 10 genes con DE más destacados según el valor p ajustado.

Este ejercicio forma parte del curso

RNA-Seq con Bioconductor en R

Ver curso

Instrucciones del ejercicio

  • Usa la función subset() para extraer aquellos valores con un valor p ajustado menor que 0.05. Guarda el subconjunto como un data frame llamado smoc2_sig utilizando la función data.frame() y pasa los nombres de fila a una columna llamada geneID con la función rownames_to_column().

  • Ordena los resultados significativos por los valores p ajustados usando la función arrange(), selecciona las columnas con el identificador de gen de Ensembl y los valores p ajustados, y muestra los genes más significativos usando head().

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Select significant genese with padj < 0.05
smoc2_sig <- subset(___, ___) %>%
  				___() %>%
  				___(var = ___)

# Extract the top 6 genes with padj values
smoc2_sig %>%
	___(___) %>%
	select(___, ___) %>%
	head()
Editar y ejecutar código