Hasil analisis DE
Setelah mengeksplorasi PCA dan heatmap korelasi, kita menemukan pengelompokan yang baik pada PC1, yang tampaknya merepresentasikan variasi data akibat fibrosis, dan PC2, yang tampaknya merepresentasikan variasi data akibat overekspresi smoc2. Kita tidak menemukan sumber variasi tambahan dalam data maupun pencilan yang perlu dihapus. Oleh karena itu, kita dapat melanjutkan dengan menjalankan DESeq2, pengujian DE, dan melakukan shrink pada fold change. Langkah-langkah ini telah kami jalankan untuk Anda guna menghasilkan hasil akhir, res_all.
Dalam latihan ini, kita akan mengambil subset gen yang signifikan dari hasil tersebut dan menampilkan 10 gen DE teratas berdasarkan p-value tersesuaikan.
Latihan ini adalah bagian dari kursus
RNA-Seq dengan Bioconductor di R
Petunjuk latihan
Gunakan fungsi
subset()untuk mengekstrak nilai dengan p-value tersesuaikan kurang dari 0,05. Simpan subset sebagai data frame bernamasmoc2_sigdengan menggunakan fungsidata.frame()dan ubah nama baris menjadi kolom bernamageneIDmenggunakan fungsirownames_to_column().Urutkan hasil signifikan berdasarkan p-value tersesuaikan menggunakan fungsi
arrange(), pilih kolom dengan Ensembl gene ID dan p-value tersesuaikan, lalu tampilkan gen paling signifikan menggunakanhead().
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Select significant genese with padj < 0.05
smoc2_sig <- subset(___, ___) %>%
___() %>%
___(var = ___)
# Extract the top 6 genes with padj values
smoc2_sig %>%
___(___) %>%
select(___, ___) %>%
head()