Visualizar relaciones bivariadas
Si quieres ir más allá de simplemente dibujar variables y, en su lugar, investigar si existe alguna relación entre 2 variables, puedes trazar un diagrama de dispersión. Es un gráfico en el que los valores de dos variables se representan a lo largo de dos ejes.
El patrón de los puntos resultantes se utiliza para detectar la presencia de correlación; normalmente se añade una recta de regresión para identificar la tendencia, si la hay:
- Una recta de regresión con pendiente ascendente indica una relación lineal positiva entre A y B (cuando A sube, B tiende a subir también)
- Una recta de regresión con pendiente descendente indica una relación lineal negativa entre A y B
Puedes dibujar un diagrama de dispersión y luego crear un modelo de regresión con las siguientes funciones:
plot(x = A, y = B)
lm(B ~ A)
En este ejercicio, trazarás un diagrama de dispersión y la recta de regresión para las series de rentabilidad del SP500 (sp500) y Citigroup (citi) desde enero de 2015 hasta enero de 2017, ambas disponibles en tu espacio de trabajo
Este ejercicio forma parte del curso
Visualización de series temporales en R
Instrucciones del ejercicio
- Dibuja un diagrama de dispersión con
sp500en el eje x ycitien el eje y. - Añade una recta de regresión de
citifrente asp500usandolm()yabline().- Especifica la regresión como el argumento
regdeabline(). - Haz esta línea roja y el doble de gruesa que la predeterminada.
- Especifica la regresión como el argumento
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Draw the scatterplot
# Draw a regression line