CommencerCommencez gratuitement

Extraire un échantillon d’un fichier fastq

À vous de tirer un échantillon à partir d’une séquence contenant de nombreuses lectures.

Vous allez utiliser le même fichier que dans l’exercice précédent. Ce fichier contient 500 lectures, chacune de 50 pb. Le chemin du fichier est stocké dans un objet appelé f.

En utilisant FastqSampler(con = file_path, n = length), set.seed() et yield(), vous pouvez extraire 100 lectures de votre fichier de séquences.

Cet exercice fait partie du cours

<cours>Introduction à Bioconductor avec R</cours>
Voir le cours

Instructions de l’exercice

  • Chargez ShortRead.
  • Utilisez set.seed() avec la valeur 1234.
  • Utilisez FastqSampler() avec le petit fichier fastq situé dans f et sélectionnez 100 lectures.
  • Utilisez yield() pour générer la sous‑séquence.

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Load ShortRead
library(ShortRead)

# Set a seed for sampling
___

# Use FastqSampler with f and select 100 reads
fs <- ___(con = ___, ___ = ___)

# Generate new sample yield
my_sample <- ___

# Print my_sample
___
Modifier et exécuter le code