Filtrer les gènes
Maintenant que les données ont été transformées en log et normalisées par quantiles, vous devez supprimer les gènes faiblement exprimés qui ne sont pas pertinents pour le système étudié.
Cet exercice fait partie du cours
Analyse d’expression différentielle avec limma en R
Instructions
L’objet ExpressionSet eset_norm contenant les données de peuplier normalisées a été chargé dans votre espace de travail.
Utilisez
plotDensitiespour visualiser la distribution des niveaux d’expression génique pour chaque échantillon. Désactivez la légende.Utilisez
rowMeanspour déterminer quels gènes ont un niveau d’expression moyen supérieur à 5. Nommez ce vecteur logiquekeep.Filtrez les gènes (c.-à-d. les lignes) de l’objet ExpressionSet avec le vecteur logique
keepet revérifiez la visualisation.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
library(limma)
# Create new ExpressionSet to store filtered data
eset <- eset_norm
# View the normalized gene expression levels
___(eset, legend = ___); abline(v = 5)
# Determine the genes with mean expression level greater than 5
keep <- ___(exprs(eset)) > ___
sum(keep)
# Filter the genes
eset <- eset[___]
___(eset, legend = ___)