Extraire un échantillon d’un fichier fastq
À vous de tirer un échantillon à partir d’une séquence contenant de nombreuses lectures.
Vous allez utiliser le même fichier que dans l’exercice précédent. Ce fichier contient 500 lectures, chacune de 50 pb. Le chemin du fichier est stocké dans un objet appelé f.
En utilisant FastqSampler(con = file_path, n = length), set.seed() et yield(), vous pouvez extraire 100 lectures de votre fichier de séquences.
Cet exercice fait partie du cours
Introduction à Bioconductor avec R
Instructions
- Chargez
ShortRead. - Utilisez
set.seed()avec la valeur1234. - Utilisez
FastqSampler()avec le petit fichier fastq situé dansfet sélectionnez 100 lectures. - Utilisez
yield()pour générer la sous‑séquence.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Load ShortRead
library(ShortRead)
# Set a seed for sampling
___
# Use FastqSampler with f and select 100 reads
fs <- ___(con = ___, ___ = ___)
# Generate new sample yield
my_sample <- ___
# Print my_sample
___