Pics vs arrière-plan
Il est temps de comparer la distribution de couverture des pics, des régions en liste noire et de l’arrière-plan. Dans cet exercice, vous allez examiner les données du chromosome 5.
Les nombres de lectures regroupés par fenêtres pour les pics, les régions en liste noire et l’arrière-plan pour ce chromosome sont disponibles respectivement sous peak_bins, bl_bins et
bkg_bins. La colonne score contient les nombres de lectures.
Le chargement de toutes les données et des packages R requis pour cet exercice peut prendre un instant. Merci de votre patience.
Cet exercice fait partie du cours
ChIP-seq avec Bioconductor en R
Instructions
- Préparez les nombres de lectures pour la visualisation en les organisant dans des data frames.
- Combinez les trois data frames avec
rbind(). - Créez un boîte à moustaches (boxplot) des nombres de lectures par type de fenêtre.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Prepare read counts for plotting by organising them in data frames
peak_scores <- data.frame(source="peaks", fragments=___$score)
bl_scores <- data.frame(source="blacklist", fragments=___)
bkg_scores <- data.frame(source="background", fragments=___)
scores <- rbind(___, ___, ___)
# Create a boxplot of the read counts by bin type
ggplot(___, aes(y=fragments, x=source)) + geom_boxplot()