Supprimer les doublons
Il est toujours recommandé de vérifier que vos lectures de séquence ne contiennent pas trop de doublons.
# Échantillon avec doublons de classe : ShortReadQ
dfqsample
# Récupérer les lectures depuis dfqsample
mydReads <- sread(dfqsample)
# Compter les doublons
table(srduplicated(mydReads))
Comment supprimeriez-vous les lectures dupliquées dans un fichier ? Faites attention à la condition à utiliser dans ce filtre.
Cet exercice fait partie du cours
<cours>Introduction à Bioconductor avec R</cours>Exercice interactif pratique
Transformez la théorie en action avec l’un de nos exercices interactifs
Commencer l’exercice