Prétraiter les features
Dans la vidéo d’exercices, vous avez vu que les distributions d’échantillons pour l’étude sur la doxorubicine étaient fortement asymétriques à droite. La première étape consiste donc à prétraiter les features : transformation logarithmique, normalisation et filtrage.
Cet exercice fait partie du cours
Analyse d’expression différentielle avec limma en R
Instructions
L’objet ExpressionSet eset_raw contenant les données brutes a été chargé dans votre espace de travail. Le package limma est chargé.
Appliquez une transformation logarithmique aux mesures. Utilisez
plotDensitiespour visualiser. Étiquetez les échantillons par leur génotype.Normalisez les mesures par quantiles avec
normalizeBetweenArrayset re-visualisez.Utilisez
rowMeanspour déterminer quels gènes ont un niveau d’expression moyen supérieur à 0.Filtrez les gènes (c.-à-d. les lignes) avec le vecteur logique
keepet re-visualisez.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create a new ExpressionSet to store the processed data
eset <- eset_raw
# Log transform
exprs(eset) <- ___(exprs(eset))
___(eset, group = pData(eset)[___], legend = "topright")
# Quantile normalize
exprs(eset) <- ___(exprs(eset))
___(eset, group = pData(eset)[___], legend = "topright")
# Determine the genes with mean expression level greater than 0
keep <- ___(exprs(eset)) > ___
sum(keep)
# Filter the genes
eset <- eset[___]
___(eset, group = pData(eset)[___], legend = "topright")