Neem een steekproef uit een fastq-bestand
Jij bent aan de beurt om een steekproef te trekken uit een sequentie met veel reads.
Je gebruikt hetzelfde bestand als in de vorige oefening. Dit bestand bevat 500 reads, elk van 50 bp. Het bestandspad staat in een object f.
Met FastqSampler(con = file_path, n = length), set.seed() en yield() kun je 100 reads uit je sequentiebestand selecteren.
Deze oefening maakt deel uit van de cursus
Introductie tot Bioconductor in R
Oefeninstructies
- Laad
ShortRead. - Gebruik
set.seed()met waarde1234. - Gebruik
FastqSampler()met het kleine fastq-bestand infen selecteer 100 reads. - Gebruik
yield()om de subset te genereren.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Load ShortRead
library(ShortRead)
# Set a seed for sampling
___
# Use FastqSampler with f and select 100 reads
fs <- ___(con = ___, ___ = ___)
# Generate new sample yield
my_sample <- ___
# Print my_sample
___