ComenzarEmpieza gratis

Joins con valores faltantes

Se han cargado en tu sesión de R dos nuevos data.tables: heart y cardio. Cada uno contiene un conjunto de sondas de microarrays que has encontrado asociadas con enfermedad cardiaca en dos estudios independientes*. Cada sonda mide los niveles de expresión de un gen. Cada gen puede medirse con una o más sondas, y algunas sondas no tienen ninguna anotación génica conocida en la secuencia de referencia del genoma humano. Los dos estudios usaron plataformas de microarrays diferentes que emplean sondas distintas para medir cada gen. Tu objetivo es averiguar qué genes mostraron asociaciones reproducibles con la enfermedad cardiaca en ambos estudios.

* Nota: las asociaciones se han generado aleatoriamente; no representan ningún hallazgo biológico real ni un conjunto de datos real.

Este ejercicio forma parte del curso

Unir datos con data.table en R

Ver curso

Instrucciones del ejercicio

  • Usando la función merge(), realiza un inner join de cardio con heart incluyendo el argumento adecuado para evitar cualquier error que aparezca.
  • Elimina las sondas de ambos data.tables que no tengan anotación génica (es decir, elimina las filas con valores faltantes en la columna gene).
  • Repite el inner join con los nuevos data.tables para obtener un data.table con las asociaciones reproducibles entre genes y enfermedad cardiaca.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Try an inner join
___

# Filter missing values
heart_2 <- ___
cardio_2 <- ___

# Inner join the filtered data.tables
___
Editar y ejecutar código