CommencerCommencer gratuitement

Utiliser des annotations

Dans cet exercice, vous allez utiliser les coordonnées de gènes obtenues depuis le package TxDb.Hsapiens.UCSC.hg19.knownGene. Ce package fournit les coordonnées de tous les gènes humains connus. Un objet GRanges contenant les coordonnées et un identifiant unique pour les gènes du chromosome 20 a été chargé pour vous sous le nom human_genes.

Bien que ces identifiants soient utiles pour reconnaître les gènes, ils ne sont pas faciles à interpréter. Il peut être utile d’ajouter également les symboles de gènes, plus lisibles pour les humains. Cela peut être fait à l’aide du package org.Hs.eg.db, qui fournit des correspondances entre différents ensembles d’identifiants de gènes. La fonction select() vous permet d’obtenir, pour chaque identifiant, un symbole de gène stocké dans la colonne SYMBOL. Une fois cette information extraite, vous pouvez l’ajouter à la table des positions des gènes.

Cet exercice fait partie du cours

ChIP-seq avec Bioconductor en R

Afficher le cours

Instructions

  • Récupérez les symboles de gènes depuis la colonne SYMBOL de org.Hs.eg.db.
  • Examinez la structure des annotations renvoyées.
  • Ajoutez les symboles de gènes à human_genes.
  • Examinez le résultat.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Obtain gene symbols
gene_symbol <- ___(org.Hs.eg.db, keys=human_genes$gene_id, columns="SYMBOL", keytype="ENTREZID")

# Examine the structure of the returned annotations
str(___)

# Add gene symbols to gene coordinates
human_genes$symbol <- ___

# Examine output
print(human_genes)
Modifier et exécuter le code