CommencerCommencer gratuitement

Explorer un fichier fastq

Les fichiers fastq contiennent généralement des milliers voire des millions de lectures, et peuvent devenir très volumineux ! Pour cet exercice, vous utiliserez un petit sous-échantillon fastq de 500 lectures, qui tient facilement en mémoire et peut être lu entièrement avec la fonction readFastq().

Le fichier de séquences original provient d’Arabidopsis thaliana, fourni par l’UC Davis Genome Center. Le numéro d’accession est SRR1971253 et il a été téléchargé depuis le Sequence Read Archive (SRA). Il contient de l’ADN issu de tissus foliaires, regroupé puis séquencé sur un Illumina HiSeq 2000. Ces séquences sont des lectures simples (single-read) d’une longueur de 50 paires de bases (pb).

fqsample est un objet ShortReadQ et contient des informations sur les lectures, les scores de qualité et les identifiants. À vous de l’explorer !

Cet exercice fait partie du cours

Introduction à Bioconductor avec R

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Load ShortRead
___

# Print fqsample
___
Modifier et exécuter le code