1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Trực quan hóa dữ liệu chuỗi thời gian trong R

Connected

Bài tập

Trực quan hóa mối quan hệ hai biến

Nếu bạn muốn đi xa hơn việc chỉ vẽ các biến và thay vào đó kiểm tra xem có mối quan hệ nào giữa 2 biến hay không, bạn có thể vẽ một biểu đồ phân tán (scatterplot). Đây là dạng đồ thị trong đó giá trị của hai biến được đặt lên hai trục.

Mẫu hình của các điểm giúp phát hiện sự hiện diện của tương quan; thường sẽ thêm một đường hồi quy để nhận diện xu hướng, nếu có:

  • Đường hồi quy dốc lên cho thấy mối quan hệ tuyến tính dương giữa A và B (khi A tăng, B cũng có xu hướng tăng)
  • Đường hồi quy dốc xuống cho thấy mối quan hệ tuyến tính âm giữa A và B

Bạn có thể vẽ biểu đồ phân tán rồi tạo mô hình hồi quy với các hàm sau:

plot(x = A, y = B)
lm(B ~ A)

Trong bài tập này, bạn sẽ vẽ biểu đồ phân tán và đường hồi quy cho chuỗi lợi nhuận của SP500 (sp500) và Citigroup (citi) từ tháng 1/2015 đến tháng 1/2017; cả hai đều đã có sẵn trong workspace của bạn

Hướng dẫn

100 XP
  • Vẽ biểu đồ phân tán với sp500 trên trục x và citi trên trục y.
  • Thêm đường hồi quy của citi theo sp500 bằng lm() và abline().
    • Truyền mô hình hồi quy làm đối số reg cho abline().
    • Tô màu đường này đỏ và tăng độ dày lên gấp đôi so với mặc định.