Lettura di file BAM
Per iniziare, leggerai i read mappati da un file BAM in R. Questi file memorizzano, in un formato binario compresso, le informazioni sull’allineamento tra le sequenze lette e il genoma di riferimento. Caricare dati dai file BAM è un’operazione comune quando si analizzano dati genomici.
In questo esercizio, per prima cosa caricherai tutti i read da un file BAM. È semplice, ma può richiedere molta memoria; quindi, nella seconda parte imparerai a caricare soltanto i read da una regione di interesse.
Questo esercizio fa parte del corso
ChIP-seq con Bioconductor in R
Istruzioni dell'esercizio
- Carica i read dal file chr20_bam usando la funzione
readGAlignments(). - Crea un oggetto
BamViewsper chr20_bam che copra la regione 29805000 - 29820000 sul cromosoma 20. - Usa di nuovo
readGAlignments()per caricare solo i read in quella vista. - Ispeziona l’oggetto
reads_subusandostr().
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Load reads form chr20_bam file
reads <- ___(chr20_bam)
# Create a `BamViews` object for the range 29805000 - 29820000 on chromosome 20
bam_views <- ___(___, bamRanges=GRanges("chr20", IRanges(start=29805000, end=29820000)))
# Load only the reads in that view
reads_sub <- ___(___)
# Inspect the `reads_sub` object
___(reads_sub)