Aan de slagGa gratis aan de slag

Removing duplicates

It is always a good practice to check that your sequence reads don't contain too many duplicates.

# Sample with duplicates of class: ShortReadQ
dfqsample

# Get the reads from dfqsample
mydReads <- sread(dfqsample)

# Counting duplicates
table(srduplicated(mydReads))

How would you go about removing duplicated reads in a file? Pay attention to what the condition should be in this filter.

Deze oefening maakt deel uit van de cursus

Introduction to Bioconductor in R

Cursus bekijken

Praktische interactieve oefening

Zet theorie om in actie met een van onze interactieve oefeningen.

Begin met trainen