Filtrer des reads à la volée !
Et si, parmi tous les reads d’un fichier, seuls certains vous intéressaient ? Vous pouvez utiliser un filtre !
Supposons que vous ne vouliez garder que les reads qui commencent par le motif "ATGCA". Une petite fonction de filtrage peut faire l’affaire en utilisant la fonction srFilter() :
myStartFilter <- srFilter(function(x) substr(sread(x), 1, 5) == "ATGCA")
Cette fonction, déjà créée pour vous, prend en entrée un objet dérivé de ShortRead et renvoie les reads qui commencent par le motif "ATGCA". Mettons-la en pratique !
Cet exercice fait partie du cours
Introduction à Bioconductor avec R
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Load package ShortRead
library(ShortRead)
# Check class of fqsample
___
# Filter reads into selectedReads using myStartFilter
selectedReads <- fqsample[___(___)]
# Check class of selectedReads
___