CommencerCommencer gratuitement

Extraire un échantillon d’un fichier fastq

À vous de tirer un échantillon à partir d’une séquence contenant de nombreuses lectures.

Vous allez utiliser le même fichier que dans l’exercice précédent. Ce fichier contient 500 lectures, chacune de 50 pb. Le chemin du fichier est stocké dans un objet appelé f.

En utilisant FastqSampler(con = file_path, n = length), set.seed() et yield(), vous pouvez extraire 100 lectures de votre fichier de séquences.

Cet exercice fait partie du cours

Introduction à Bioconductor avec R

Afficher le cours

Instructions

  • Chargez ShortRead.
  • Utilisez set.seed() avec la valeur 1234.
  • Utilisez FastqSampler() avec le petit fichier fastq situé dans f et sélectionnez 100 lectures.
  • Utilisez yield() pour générer la sous‑séquence.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Load ShortRead
library(ShortRead)

# Set a seed for sampling
___

# Use FastqSampler with f and select 100 reads
fs <- ___(con = ___, ___ = ___)

# Generate new sample yield
my_sample <- ___

# Print my_sample
___
Modifier et exécuter le code