CommencerCommencer gratuitement

Filtrer les reads

Dans cet exercice, vous allez encore nettoyer les données en supprimant les reads dont l’alignement est de faible qualité. Pour cela, vous devez charger les qualités d’alignement depuis le fichier BAM. Elles sont stockées dans le champ mapq.

Cet exercice fait partie du cours

ChIP-seq avec Bioconductor en R

Afficher le cours

Instructions

  • Chargez reads avec les informations de qualité d’alignement attachées à chaque read.
  • Identifiez tous les alignements avec une qualité d’au moins 20.
  • Créez un boxplot pour comparer les distributions de qualité d’alignement entre les groupes de haute et de faible qualité.
  • Supprimez tous les alignements de faible qualité.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Load reads with mapping qualities by requesting the "mapq" entries
reads <- readGAlignments(bam_file, param=ScanBamParam(what=___))

# Identify good quality alignments
high_mapq <- mcols(reads)$mapq >= ___

# Examine mapping quality distribution for high and low quality alignments
___(mcols(reads)$mapq ~ high_mapq, xlab="good quality alignments", ylab="mapping quality")

# Remove low quality alignments
reads_good <- subset(reads, ___)
Modifier et exécuter le code