Partitionner le génome de la levure
Les génomes sont souvent volumineux, mais l’intérêt porte généralement sur des régions précises. Il faut donc créer des sous-ensembles d’un génome en en extrayant des portions. Pour sélectionner un intervalle de séquence, utilisez getSeq() et indiquez le nom du chromosome ainsi que les positions de début et de fin de l’intervalle.
L’exemple suivant sélectionne les bases de "chrI" de 100 à 150.
getSeq(yeastGenome, names = "chrI", start = 100, end = 150)
Remarque : names est optionnel ; s’il n’est pas spécifié, toutes les chromosomes seront renvoyés. Les paramètres start et end sont également optionnels et, s’ils ne sont pas spécifiés, prennent respectivement les valeurs par défaut 1 et la longueur de la séquence.
Cet exercice fait partie du cours
Introduction à Bioconductor avec R
Instructions
- Utilisez
getSeq()pour obtenir les 30 premières bases du chromosome M ("chrM") dans l’objetyeastGenome.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Load the yeast genome
library(BSgenome.Scerevisiae.UCSC.sacCer3)
# Assign data to the yeastGenome object
yeastGenome <- BSgenome.Scerevisiae.UCSC.sacCer3
# Get the first 30 bases of chrM
___