Features pre-processen

In de video-oefening zag je dat de steekproefverdelingen voor de doxorubicine-studie sterk naar rechts scheef waren. De eerste stap is daarom het pre-processen van de features: log-transformeren, normaliseren en filteren.

Deze oefening maakt deel uit van de cursus

Differentiële-expressieanalyse met limma in R

Bekijk cursus

Oefeninstructies

Het ExpressionSet-object eset_raw met de ruwe data is in je werkruimte geladen. Het limma-pakket is geladen.

Log-transformeer de metingen. Gebruik plotDensities om te visualiseren. Label de samples met hun genotype.
Voer kwantielnormalisatie uit op de metingen met normalizeBetweenArrays en visualiseer opnieuw.
Gebruik rowMeans om te bepalen welke genen een gemiddelde expressieniveau groter dan 0 hebben.
Filter de genen (dus de rijen) met de logische vector keep en visualiseer opnieuw.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Create a new ExpressionSet to store the processed data
eset <- eset_raw
# Log transform
exprs(eset) <- ___(exprs(eset))
___(eset,  group = pData(eset)[___], legend = "topright")
# Quantile normalize
exprs(eset) <- ___(exprs(eset))
___(eset,  group = pData(eset)[___], legend = "topright")
# Determine the genes with mean expression level greater than 0
keep <- ___(exprs(eset)) > ___
sum(keep)
# Filter the genes
eset <- eset[___]
___(eset, group = pData(eset)[___], legend = "topright")

Code bewerken en uitvoeren