Analisis DE
CATATAN: Memuat latihan ini mungkin membutuhkan waktu sedikit lebih lama.
Kita akan terus menggunakan himpunan data penuh untuk membandingkan gen yang menunjukkan perbedaan ekspresi yang signifikan antara sampel normal dan fibrosis tanpa memedulikan genotipe (design: ~ genotype + condition). Oleh karena itu, kita akan menggunakan objek DESeq2 dds_all yang dibuat pada latihan sebelumnya. Asumsikan objek ini sudah dibuat dan semua pustaka sudah dimuat. Pada latihan ini, mari lakukan analisis klastering tanpa supervisi untuk menelusuri pengelompokan sampel kita dan sumber variasinya.
Latihan ini adalah bagian dari kursus
RNA-Seq dengan Bioconductor di R
Petunjuk latihan
Lakukan transformasi log pada hitungan yang dinormalisasi di dalam objek
dds_allmenggunakan fungsivst(), dalam mode blind terhadap informasi kelompok sampel.Buat heatmap korelasi dari nilai korelasi hitungan yang dinormalisasi secara log menggunakan fungsi
pheatmap(). Sertakan bilah anotasi untukgenotypedancondition.Plot PCA dengan fungsi
plotPCA()menggunakanvsd_all. Warnai plot berdasarkancondition.Plot PCA dengan fungsi
plotPCA()menggunakanvsd_all. Warnai plot berdasarkangenotype.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Log transform counts for QC
vsd_all <- ___(___, blind = ___)
# Create heatmap of sample correlation values
vsd_all %>%
___() %>%
___() %>%
___(annotation = select(all_metadata, c("___", "___")))
# Create the PCA plot for PC1 and PC2 and color by condition
___(___, ___ = ___)
# Create the PCA plot for PC1 and PC2 and color by genotype
___(___, ___ = ___)