Visualizando relações bivariadas
Se você quer ir além de simplesmente plotar variáveis e investigar se existe alguma relação entre 2 variáveis, pode desenhar um gráfico de dispersão (scatterplot). Nele, os valores das duas variáveis são plotados em dois eixos.
O padrão dos pontos resultantes ajuda a revelar a presença de correlação; normalmente, adiciona-se uma linha de regressão para identificar a tendência, caso exista:
- Uma linha de regressão com inclinação para cima indica uma relação linear positiva entre A e B (quando A aumenta, B tende a aumentar também)
- Uma linha de regressão com inclinação para baixo indica uma relação linear negativa entre A e B
Você pode desenhar um gráfico de dispersão e depois criar um modelo de regressão com as funções a seguir:
plot(x = A, y = B)
lm(B ~ A)
Neste exercício, você vai desenhar um gráfico de dispersão e a linha de regressão para as séries de retorno do SP500 (sp500) e do Citigroup (citi) de janeiro de 2015 a janeiro de 2017, ambas disponíveis no seu ambiente de trabalho
Este exercício faz parte do curso
Visualizando dados de séries temporais em R
Instruções do exercício
- Desenhe um gráfico de dispersão com
sp500no eixo x ecitino eixo y. - Adicione uma linha de regressão de
citicontrasp500usandolm()eabline().- Especifique a regressão como o argumento
regdeabline(). - Deixe essa linha vermelha e com o dobro da espessura padrão.
- Especifique a regressão como o argumento
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Draw the scatterplot
# Draw a regression line