Joins con valores faltantes
Se han cargado en tu sesión de R dos nuevos data.tables: heart y cardio. Cada uno contiene un conjunto de sondas de microarrays que has encontrado asociadas con enfermedad cardiaca en dos estudios independientes*. Cada sonda mide los niveles de expresión de un gen. Cada gen puede medirse con una o más sondas, y algunas sondas no tienen ninguna anotación génica conocida en la secuencia de referencia del genoma humano. Los dos estudios usaron plataformas de microarrays diferentes que emplean sondas distintas para medir cada gen. Tu objetivo es averiguar qué genes mostraron asociaciones reproducibles con la enfermedad cardiaca en ambos estudios.
* Nota: las asociaciones se han generado aleatoriamente; no representan ningún hallazgo biológico real ni un conjunto de datos real.
Este ejercicio forma parte del curso
Unir datos con data.table en R
Instrucciones del ejercicio
- Usando la función
merge(), realiza un inner join decardioconheartincluyendo el argumento adecuado para evitar cualquier error que aparezca. - Elimina las sondas de ambos
data.tablesque no tengan anotación génica (es decir, elimina las filas con valores faltantes en la columnagene). - Repite el inner join con los nuevos
data.tablespara obtener undata.tablecon las asociaciones reproducibles entre genes y enfermedad cardiaca.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Try an inner join
___
# Filter missing values
heart_2 <- ___
cardio_2 <- ___
# Inner join the filtered data.tables
___