Features pre-processen
In de video-oefening zag je dat de steekproefverdelingen voor de doxorubicine-studie sterk naar rechts scheef waren. De eerste stap is daarom het pre-processen van de features: log-transformeren, normaliseren en filteren.
Deze oefening maakt deel uit van de cursus
Differentiële-expressieanalyse met limma in R
Oefeninstructies
Het ExpressionSet-object eset_raw met de ruwe data is in je werkruimte geladen. Het limma-pakket is geladen.
Log-transformeer de metingen. Gebruik
plotDensitiesom te visualiseren. Label de samples met hun genotype.Voer kwantielnormalisatie uit op de metingen met
normalizeBetweenArraysen visualiseer opnieuw.Gebruik
rowMeansom te bepalen welke genen een gemiddelde expressieniveau groter dan 0 hebben.Filter de genen (dus de rijen) met de logische vector
keepen visualiseer opnieuw.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create a new ExpressionSet to store the processed data
eset <- eset_raw
# Log transform
exprs(eset) <- ___(exprs(eset))
___(eset, group = pData(eset)[___], legend = "topright")
# Quantile normalize
exprs(eset) <- ___(exprs(eset))
___(eset, group = pData(eset)[___], legend = "topright")
# Determine the genes with mean expression level greater than 0
keep <- ___(exprs(eset)) > ___
sum(keep)
# Filter the genes
eset <- eset[___]
___(eset, group = pData(eset)[___], legend = "topright")