Eksik değerlerle birleştirme
R oturumuna iki yeni data.table yüklendi: heart ve cardio. Her biri, iki ayrı çalışmada kalp hastalığıyla ilişkili olduğunu bulduğun bir dizi mikrodizin probu içeriyor*. Her prob bir genin ifade düzeylerini ölçer. Her gen bir veya daha fazla probla ölçülebilir ve bazı propların insan genomu referans dizisinde bilinen bir gen açıklaması yoktur. Bu iki çalışma, her bir geni ölçmek için farklı problar kullanan farklı mikrodizin platformları kullanmış. Amacın, her iki çalışmada da kalp hastalığıyla tekrarlanabilir ilişkilere sahip genleri bulmak.
* Not: İlişkiler rastgele üretilmiştir; gerçek biyolojik bulguları veya gerçek bir veri kümesini temsil etmez.
Bu egzersiz
R'de data.table ile Veri Birleştirme
kursunun bir parçasıdırEgzersiz talimatları
merge()fonksiyonunu kullanarak, karşılaşacağın hataları geçersiz kılmak için uygun argümanı ekleyerekcardioileheartarasında inner join yap.- Her iki
data.tabledan da gen açıklaması olmayan propları kaldır (yanigenesütununda eksik değeri olan satırları çıkar). - Gen ve kalp hastalığı arasındaki tekrarlanabilir ilişkileri elde etmek için yeni
data.tablelarla inner join işlemini tekrarla.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Try an inner join
___
# Filter missing values
heart_2 <- ___
cardio_2 <- ___
# Inner join the filtered data.tables
___