Explorando um arquivo fastq
Arquivos fastq geralmente contêm milhares ou milhões de leituras e podem ficar muito grandes! Neste exercício, você vai usar uma pequena amostra fastq de 500 leituras, que cabe facilmente na memória e pode ser lida completamente com a função readFastq().
O arquivo de sequência original vem de Arabidopsis thaliana, fornecido pelo UC Davis Genome Center. O número de acesso é SRR1971253 e foi baixado do Sequence Read Archive (SRA). Ele contém DNA de tecidos foliares, agrupados e sequenciados no Illumina HiSeq 2000. Essas sequências são leituras únicas (single-read) com comprimento de 50 pares de bases (bp).
fqsample é um objeto ShortReadQ e contém informações sobre leituras, escores de qualidade e ids. Agora é com você: explore esse objeto!
Este exercício faz parte do curso
Introdução ao Bioconductor em R
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Load ShortRead
___
# Print fqsample
___