Fazendo a correspondência entre metadados e dados de contagem
Para realizar qualquer análise com o DESeq2, precisamos criar um objeto DESeq2 fornecendo os counts brutos, os metadados e a fórmula de design. Para isso, vamos ler os dados de counts brutos e os metadados associados que criamos anteriormente, garantir que os nomes das amostras estejam na mesma ordem em ambos os conjuntos de dados e então criar um objeto DESeq2 para usar na análise de expressão diferencial. Usaremos a fórmula de design ~ condition para testar expressão diferencial entre condições (normal e fibrose).
As bibliotecas DESeq2 e dplyr já foram carregadas para você, e os arquivos smoc2_rawcounts e smoc2_metadata já foram lidos.
Este exercício faz parte do curso
RNA-Seq com Bioconductor em R
Instruções do exercício
Use a função
match()para retornar os índices de como reordenar as colunas dos dados de contagem para corresponder à ordem dos nomes das linhas dos metadados. Atribua o resultado areorder_idx.Reordene as colunas dos dados de contagem com
reorder_idxde modo que os nomes das colunas correspondam à ordem dos nomes das linhas nos metadados.Crie um objeto DESeq2,
dds_smoc2, usando a funçãoDESeqDataSetFromMatrix()com os metadados e os counts reordenados.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Use the match() function to reorder the columns of the raw counts
reorder_idx <- match(___(___), ___(___))
# Reorder the columns of the count data
reordered_smoc2_rawcounts <- smoc2_rawcounts[ , ___]
# Create a DESeq2 object
dds_smoc2 <- DESeqDataSetFromMatrix(countData = ___,
colData = ___,
design = ~ condition)