Analyse DE
REMARQUE : Le chargement de cet exercice peut prendre un peu plus de temps.
Nous allons continuer à utiliser l’ensemble de données complet pour comparer les gènes qui présentent des différences d’expression significatives entre les échantillons normaux et fibrose, indépendamment du génotype (design: ~ genotype + condition). Nous utiliserons donc notre objet DESeq2 dds_all créé dans l’exercice précédent. Supposons que cet objet est déjà créé et que toutes les bibliothèques sont chargées. Dans cet exercice, effectuons des analyses de regroupement non supervisées pour explorer le clustering de nos échantillons et les sources de variation.
Cet exercice fait partie du cours
RNA-Seq avec Bioconductor en R
Instructions
Appliquez une transformation logarithmique aux comptes normalisés dans l’objet
dds_allavec la fonctionvst(), en ignorant l’information de groupe d’échantillons (blind).Créez la carte thermique des corrélations des comptes normalisés log avec la fonction
pheatmap(). Ajoutez des barres d’annotation pourgenotypeetcondition.Tracez la PCA avec la fonction
plotPCA()en utilisantvsd_all. Colorez le graphique seloncondition.Tracez la PCA avec la fonction
plotPCA()en utilisantvsd_all. Colorez le graphique selongenotype.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Log transform counts for QC
vsd_all <- ___(___, blind = ___)
# Create heatmap of sample correlation values
vsd_all %>%
___() %>%
___() %>%
___(annotation = select(all_metadata, c("___", "___")))
# Create the PCA plot for PC1 and PC2 and color by condition
___(___, ___ = ___)
# Create the PCA plot for PC1 and PC2 and color by genotype
___(___, ___ = ___)