Metadata en tellingen matchen
Om analyses met DESeq2 uit te voeren, moeten we een DESeq2-object maken door de ruwe tellingen, metadata en designformule aan te leveren. Daarvoor lezen we de ruwe tellingen en de bijbehorende metadata die we eerder hebben gemaakt in, controleren we of de samplenames in beide gegevenssets in dezelfde volgorde staan, en maken we vervolgens een DESeq2-object voor de differentiële-expressieanalyse. We gebruiken de designformule ~ condition om te testen op differentiële expressie tussen condities (normaal en fibrose).
De libraries DESeq2 en dplyr zijn al voor je geladen, en de bestanden smoc2_rawcounts en smoc2_metadata zijn ingelezen.
Deze oefening maakt deel uit van de cursus
RNA-Seq met Bioconductor in R
Oefeninstructies
Gebruik de functie
match()om de indexen te verkrijgen voor het herordenen van de kolommen van de tellingsgegevens zodat ze overeenkomen met de volgorde van de rijnamen van de metadata. Sla het resultaat op inreorder_idx.Herschik de kolommen van de tellingen met
reorder_idxzodat de kolomnamen overeenkomen met de volgorde van de rijnamen in de metadata.Maak een DESeq2-object,
dds_smoc2, met de functieDESeqDataSetFromMatrix()met de metadata en de herordende tellingen.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Use the match() function to reorder the columns of the raw counts
reorder_idx <- match(___(___), ___(___))
# Reorder the columns of the count data
reordered_smoc2_rawcounts <- smoc2_rawcounts[ , ___]
# Create a DESeq2 object
dds_smoc2 <- DESeqDataSetFromMatrix(countData = ___,
colData = ___,
design = ~ condition)