İkili ilişkileri görselleştirme
Değişkenleri yalnızca çizmenin ötesine geçip 2 değişken arasında bir ilişki olup olmadığını incelemek istersen, bir dağılım grafiği (scatterplot) çizebilirsin. Bu, iki değişkenin değerlerinin iki eksen boyunca gösterildiği bir grafiktir.
Ortaya çıkan noktaların deseni, herhangi bir korelasyonun varlığını ortaya çıkarmak için kullanılır; genellikle eğilim varsa belirlemek için bir regresyon doğrusu eklenir:
- Yukarı eğimli bir regresyon doğrusu, A ile B arasında pozitif doğrusal bir ilişkiye işaret eder (A artarken B de artma eğilimindedir)
- Aşağı eğimli bir regresyon doğrusu, A ile B arasında negatif doğrusal bir ilişkiye işaret eder
Aşağıdaki fonksiyonlarla bir dağılım grafiği çizebilir ve ardından bir regresyon modeli oluşturabilirsin:
plot(x = A, y = B)
lm(B ~ A)
Bu egzersizde, Ocak 2015'ten Ocak 2017'ye kadar SP500 (sp500) ve Citigroup (citi) için getiri serileri üzerinde bir dağılım grafiği ve regresyon doğrusu çizeceksin; her ikisi de çalışma alanında sağlanmıştır
Bu egzersiz
R'de Zaman Serisi Verilerini Görselleştirme
kursunun bir parçasıdırEgzersiz talimatları
- x ekseninde
sp500, y eksenindecitiolacak şekilde bir dağılım grafiği çiz. lm()veabline()kullanarakciti'ninsp500'e karşı regresyon doğrusunu ekle.- Regresyonu
abline()'ınregargümanı olarak belirt. - Bu çizgiyi kırmızı yap ve varsayılan kalınlığın iki katı kalınlıkta olsun.
- Regresyonu
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Draw the scatterplot
# Draw a regression line