Filtrer les reads
Dans cet exercice, vous allez encore nettoyer les données en supprimant les reads dont l’alignement est de faible qualité. Pour cela, vous devez charger les qualités d’alignement depuis le fichier BAM. Elles sont stockées dans le champ mapq.
Cet exercice fait partie du cours
ChIP-seq avec Bioconductor en R
Instructions
- Chargez
readsavec les informations de qualité d’alignement attachées à chaque read. - Identifiez tous les alignements avec une qualité d’au moins 20.
- Créez un boxplot pour comparer les distributions de qualité d’alignement entre les groupes de haute et de faible qualité.
- Supprimez tous les alignements de faible qualité.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Load reads with mapping qualities by requesting the "mapq" entries
reads <- readGAlignments(bam_file, param=ScanBamParam(what=___))
# Identify good quality alignments
high_mapq <- mcols(reads)$mapq >= ___
# Examine mapping quality distribution for high and low quality alignments
___(mcols(reads)$mapq ~ high_mapq, xlab="good quality alignments", ylab="mapping quality")
# Remove low quality alignments
reads_good <- subset(reads, ___)