1. Nauka
  2. /
  3. Kursy
  4. /
  5. RNA-Seq z Bioconductor w R

Connected

ćwiczenie

Wyniki analizy DE

Po przeanalizowaniu PCA i macierzy korelacji stwierdziliśmy wyraźne grupowanie próbek na PC1, które zdawało się odzwierciedlać zmienność danych związaną z fibrозą, oraz na PC2, odpowiadającym zmienności wynikającej z nadekspresji smoc2. Nie znaleźliśmy dodatkowych źródeł zmienności ani wartości odstających do usunięcia. Możemy więc przejść do uruchomienia DESeq2, testowania DE oraz skurczenia wartości krotności zmian. Te kroki zostały już wykonane za ciebie, aby wygenerować ostateczne wyniki zapisane w obiekcie res_all.

W tym ćwiczeniu wyodrębnimy geny istotne statystycznie z wyników i wyświetlimy 10 najlepszych genów DE według skorygowanej wartości p.

Instrukcje

100 XP
  • Użyj funkcji subset(), aby wyodrębnić wartości ze skorygowaną wartością p mniejszą niż 0,05. Zapisz podzbiór jako ramkę danych o nazwie smoc2_sig, korzystając z funkcji data.frame() i przekształcając nazwy wierszy na kolumnę geneID za pomocą funkcji rownames_to_column().

  • Posortuj istotne wyniki według skorygowanych wartości p, używając funkcji arrange(), wybierz kolumny z identyfikatorami genów Ensembl oraz skorygowanymi wartościami p, a następnie wyświetl najistotniejsze geny za pomocą head().