Hasil analisis DE

Setelah mengeksplorasi PCA dan heatmap korelasi, kita menemukan pengelompokan yang baik pada PC1, yang tampaknya merepresentasikan variasi data akibat fibrosis, dan PC2, yang tampaknya merepresentasikan variasi data akibat overekspresi smoc2. Kita tidak menemukan sumber variasi tambahan dalam data maupun pencilan yang perlu dihapus. Oleh karena itu, kita dapat melanjutkan dengan menjalankan DESeq2, pengujian DE, dan melakukan shrink pada fold change. Langkah-langkah ini telah kami jalankan untuk Anda guna menghasilkan hasil akhir, res_all.

Dalam latihan ini, kita akan mengambil subset gen yang signifikan dari hasil tersebut dan menampilkan 10 gen DE teratas berdasarkan p-value tersesuaikan.

Latihan ini merupakan bagian dari kursus

RNA-Seq dengan Bioconductor di R

Lihat Kursus

Instruksi latihan

Gunakan fungsi subset() untuk mengekstrak nilai dengan p-value tersesuaikan kurang dari 0,05. Simpan subset sebagai data frame bernama smoc2_sig dengan menggunakan fungsi data.frame() dan ubah nama baris menjadi kolom bernama geneID menggunakan fungsi rownames_to_column().
Urutkan hasil signifikan berdasarkan p-value tersesuaikan menggunakan fungsi arrange(), pilih kolom dengan Ensembl gene ID dan p-value tersesuaikan, lalu tampilkan gen paling signifikan menggunakan head().

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Select significant genese with padj < 0.05
smoc2_sig <- subset(___, ___) %>%
  				___() %>%
  				___(var = ___)

# Extract the top 6 genes with padj values
smoc2_sig %>%
	___(___) %>%
	select(___, ___) %>%
	head()

Edit dan Jalankan Kode