Lecture de fichiers BAM
Pour commencer, vous allez importer dans R des reads alignés depuis un fichier BAM. Ces fichiers stockent, dans un format binaire compressé, les informations d’alignement entre les séquences lues et le génome de référence. Charger des données à partir de fichiers BAM est une tâche courante en analyse génomique.
Dans cet exercice, vous allez d’abord charger tous les reads d’un fichier BAM. C’est simple, mais cela peut consommer beaucoup de mémoire ; dans la seconde partie, vous apprendrez donc à ne charger que les reads d’une région d’intérêt.
Cet exercice fait partie du cours
ChIP-seq avec Bioconductor en R
Instructions
- Chargez les reads du fichier chr20_bam avec la fonction
readGAlignments(). - Créez un objet
BamViewspour chr20_bam couvrant la région 29 805 000 - 29 820 000 sur le chromosome 20. - Utilisez à nouveau
readGAlignments()pour ne charger que les reads dans cette vue. - Examinez l’objet
reads_subavecstr().
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Load reads form chr20_bam file
reads <- ___(chr20_bam)
# Create a `BamViews` object for the range 29805000 - 29820000 on chromosome 20
bam_views <- ___(___, bamRanges=GRanges("chr20", IRanges(start=29805000, end=29820000)))
# Load only the reads in that view
reads_sub <- ___(___)
# Inspect the `reads_sub` object
___(reads_sub)