Pra-pemrosesan fitur
Pada latihan video, Anda melihat bahwa distribusi sampel untuk studi doxorubicin sangat condong ke kanan. Karena itu, langkah pertama yang perlu Anda lakukan adalah pra-memroses fitur: transformasi log, normalisasi, dan penyaringan.
Latihan ini adalah bagian dari kursus
Analisis Ekspresi Diferensial dengan limma di R
Petunjuk latihan
Objek ExpressionSet eset_raw dengan data mentah telah dimuat ke ruang kerja Anda. Paket limma sudah dimuat.
Lakukan transformasi log pada pengukuran. Gunakan
plotDensitiesuntuk memvisualisasikan. Beri label sampel berdasarkan genotipe mereka.Lakukan normalisasi kuantil pada pengukuran dengan
normalizeBetweenArraysdan visualisasikan kembali.Gunakan
rowMeansuntuk menentukan gen mana yang memiliki tingkat ekspresi rata-rata lebih besar dari 0.Saring gen (yaitu baris) dengan vektor logika
keepdan visualisasikan kembali.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create a new ExpressionSet to store the processed data
eset <- eset_raw
# Log transform
exprs(eset) <- ___(exprs(eset))
___(eset, group = pData(eset)[___], legend = "topright")
# Quantile normalize
exprs(eset) <- ___(exprs(eset))
___(eset, group = pData(eset)[___], legend = "topright")
# Determine the genes with mean expression level greater than 0
keep <- ___(exprs(eset)) > ___
sum(keep)
# Filter the genes
eset <- eset[___]
___(eset, group = pData(eset)[___], legend = "topright")