IniziaInizia gratis

Filtrare le letture

In questo esercizio pulirai ulteriormente i dati rimuovendo le letture con allineamenti di bassa qualità. Per farlo, devi caricare le qualità di allineamento dal file BAM. Queste sono memorizzate nel campo mapq.

Questo esercizio fa parte del corso

ChIP-seq con Bioconductor in R

Visualizza il corso

Istruzioni dell'esercizio

  • Carica reads con le informazioni sulla qualità di allineamento associate a ciascuna lettura.
  • Identifica tutti gli allineamenti con qualità almeno pari a 20.
  • Crea un boxplot per confrontare le distribuzioni della qualità di allineamento tra i gruppi ad alta e bassa qualità.
  • Rimuovi tutti gli allineamenti di bassa qualità.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Load reads with mapping qualities by requesting the "mapq" entries
reads <- readGAlignments(bam_file, param=ScanBamParam(what=___))

# Identify good quality alignments
high_mapq <- mcols(reads)$mapq >= ___

# Examine mapping quality distribution for high and low quality alignments
___(mcols(reads)$mapq ~ high_mapq, xlab="good quality alignments", ylab="mapping quality")

# Remove low quality alignments
reads_good <- subset(reads, ___)
Modifica ed esegui il codice