Junções com valores ausentes
Dois novos data.tables foram carregados na sua sessão do R: heart e cardio. Cada um contém um conjunto de sondas de microarranjo que você encontrou associadas à doença cardíaca em dois estudos distintos*. Cada sonda mede os níveis de expressão de um gene. Cada gene pode ser medido por uma ou mais sondas, e algumas sondas não têm nenhuma anotação de gene conhecida na sequência de referência do genoma humano. Os dois estudos usaram plataformas de microarranjo diferentes, que utilizam sondas distintas para medir cada gene. Seu objetivo é descobrir quais genes tiveram associações reprodutíveis com doença cardíaca em ambos os estudos.
* Observação: as associações foram geradas aleatoriamente e não representam nenhum achado biológico verdadeiro ou conjunto de dados real.
Este exercício faz parte do curso
Combinando dados com data.table em R
Instruções do exercício
- Usando a função
merge(), faça um inner join decardiocomheartcom o argumento apropriado para substituir quaisquer erros que você encontrar. - Remova as sondas de ambos os
data.tablessem anotação de gene (isto é, remova as linhas com valores ausentes na colunagene). - Repita o inner join com os novos
data.tablespara obter umdata.tablecom associações reprodutíveis entre genes e doença cardíaca.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Try an inner join
___
# Filter missing values
heart_2 <- ___
cardio_2 <- ___
# Inner join the filtered data.tables
___