Visualizzare relazioni bivariate
Se vuoi andare oltre il semplice grafico delle variabili e indagare se esiste una relazione tra 2 variabili, puoi disegnare uno scatterplot (diagramma a dispersione). È un grafico in cui i valori di due variabili sono rappresentati lungo due assi.
Il pattern dei punti risultanti serve a rivelare l'eventuale presenza di correlazione; di solito si aggiunge una retta di regressione per identificare la tendenza, se presente:
- Una retta di regressione con pendenza positiva indica una relazione lineare positiva tra A e B (quando A aumenta, anche B tende ad aumentare)
- Una retta di regressione con pendenza negativa indica una relazione lineare negativa tra A e B
Puoi disegnare uno scatterplot e poi creare un modello di regressione con le seguenti funzioni:
plot(x = A, y = B)
lm(B ~ A)
In questo esercizio, disegnerai uno scatterplot e la retta di regressione per le serie dei rendimenti dello SP500 (sp500) e di Citigroup (citi) da gennaio 2015 a gennaio 2017, entrambe già disponibili nel tuo workspace
Questo esercizio fa parte del corso
Visualizzare le serie temporali in R
Istruzioni dell'esercizio
- Disegna uno scatterplot con
sp500sull'asse x ecitisull'asse y. - Aggiungi una retta di regressione di
citirispetto asp500usandolm()eabline().- Specifica la regressione come argomento
regdiabline(). - Rendi questa linea rossa e due volte più spessa di quella predefinita.
- Specifica la regressione come argomento
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Draw the scatterplot
# Draw a regression line