Supprimer les doublons
Il est toujours recommandé de vérifier que vos lectures de séquence ne contiennent pas trop de doublons.
# Échantillon avec doublons de classe : ShortReadQ
dfqsample
# Récupérer les lectures depuis dfqsample
mydReads <- sread(dfqsample)
# Compter les doublons
table(srduplicated(mydReads))
Comment supprimeriez-vous les lectures dupliquées dans un fichier ? Faites attention à la condition à utiliser dans ce filtre.
Cet exercice fait partie du cours
Introduction à Bioconductor avec R
Exercice interactif pratique
Passez de la théorie à la pratique avec l’un de nos exercices interactifs
Commencer l’exercice