Particionando o genoma de levedura
Genomas costumam ser grandes, mas o interesse geralmente está em regiões específicas. Por isso, precisamos filtrar um genoma extraindo partes dele. Para escolher um intervalo de sequência, use getSeq() e especifique o nome do cromossomo e o início e o fim do intervalo.
O exemplo a seguir seleciona as bases de "chrI" de 100 a 150.
getSeq(yeastGenome, names = "chrI", start = 100, end = 150)
Observação: names é opcional; se não for especificado, serão retornados todos os cromossomos. Os parâmetros start e end também são opcionais e, se não forem especificados, assumem os valores padrão 1 e o comprimento da sequência, respectivamente.
Este exercício faz parte do curso
Introdução ao Bioconductor em R
Instruções do exercício
- Use
getSeq()para obter as primeiras 30 bases do cromossomo M ("chrM") no objetoyeastGenome.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Load the yeast genome
library(BSgenome.Scerevisiae.UCSC.sacCer3)
# Assign data to the yeastGenome object
yeastGenome <- BSgenome.Scerevisiae.UCSC.sacCer3
# Get the first 30 bases of chrM
___