Aan de slagGa gratis aan de slag

Metadata en tellingen matchen

Om analyses met DESeq2 uit te voeren, moeten we een DESeq2-object maken door de ruwe tellingen, metadata en designformule aan te leveren. Daarvoor lezen we de ruwe tellingen en de bijbehorende metadata die we eerder hebben gemaakt in, controleren we of de samplenames in beide gegevenssets in dezelfde volgorde staan, en maken we vervolgens een DESeq2-object voor de differentiële-expressieanalyse. We gebruiken de designformule ~ condition om te testen op differentiële expressie tussen condities (normaal en fibrose).

De libraries DESeq2 en dplyr zijn al voor je geladen, en de bestanden smoc2_rawcounts en smoc2_metadata zijn ingelezen.

Deze oefening maakt deel uit van de cursus

RNA-Seq met Bioconductor in R

Cursus bekijken

Oefeninstructies

  • Gebruik de functie match() om de indexen te verkrijgen voor het herordenen van de kolommen van de tellingsgegevens zodat ze overeenkomen met de volgorde van de rijnamen van de metadata. Sla het resultaat op in reorder_idx.

  • Herschik de kolommen van de tellingen met reorder_idx zodat de kolomnamen overeenkomen met de volgorde van de rijnamen in de metadata.

  • Maak een DESeq2-object, dds_smoc2, met de functie DESeqDataSetFromMatrix() met de metadata en de herordende tellingen.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Use the match() function to reorder the columns of the raw counts
reorder_idx <- match(___(___), ___(___))

# Reorder the columns of the count data
reordered_smoc2_rawcounts <- smoc2_rawcounts[ , ___]

# Create a DESeq2 object
dds_smoc2 <- DESeqDataSetFromMatrix(countData =  ___,
                              colData =  ___,
                              design = ~ condition)
Code bewerken en uitvoeren