Melakukan join dengan nilai yang hilang
Dua data.table baru telah dimuat ke sesi R Anda: heart dan cardio. Masing-masing berisi sekumpulan probe mikroarray yang Anda temukan terkait dengan penyakit jantung dalam dua studi terpisah*. Setiap probe mengukur tingkat ekspresi suatu gen. Setiap gen dapat diukur oleh satu atau lebih probe, dan beberapa probe tidak memiliki anotasi gen apa pun yang diketahui dalam sekuens referensi genom manusia. Kedua studi menggunakan platform mikroarray yang berbeda, yang memakai probe berbeda untuk mengukur setiap gen. Tujuan Anda adalah menemukan gen mana yang memiliki asosiasi yang dapat direproduksi dengan penyakit jantung pada kedua studi.
* Catatan: asosiasi dibuat secara acak, tidak mewakili temuan biologis sebenarnya atau himpunan data nyata.
Latihan ini adalah bagian dari kursus
Menggabungkan Data dengan data.table di R
Petunjuk latihan
- Dengan fungsi
merge(), lakukan inner joincardiokeheartdengan argumen yang sesuai untuk menimpa galat apa pun yang Anda temui. - Hapus probe dari kedua
data.tableyang tidak memiliki anotasi gen (yaitu, hapus baris dengan nilai hilang pada kolomgene). - Ulangi inner join dengan
data.tableyang baru untuk mendapatkandata.tableberisi asosiasi yang dapat direproduksi antara gen dan penyakit jantung.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Try an inner join
___
# Filter missing values
heart_2 <- ___
cardio_2 <- ___
# Inner join the filtered data.tables
___