1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Nhập môn Mô hình tuyến tính với Python

Connected

Bài tập

Nội suy: Khoảng thời gian ở giữa

Trong bài tập này, bạn sẽ xây dựng một mô hình tuyến tính bằng cách khớp dữ liệu chuỗi thời gian theo tháng cho Dow Jones Industrial Average (DJIA), rồi dùng mô hình đó để dự đoán cho dữ liệu theo ngày (tức là nội suy). Sau đó, bạn sẽ so sánh dự đoán theo ngày đó với dữ liệu DJIA theo ngày thực tế.

Một vài lưu ý về dữ liệu. "OHLC" là viết tắt của "Open-High-Low-Close" (Mở-Cao-Thấp-Đóng), thường là dữ liệu theo ngày, ví dụ giá mở cửa và đóng cửa, cùng mức giá cao nhất và thấp nhất của một cổ phiếu trong một ngày. "DayCount" là số nguyên biểu thị số ngày tính từ lúc bắt đầu thu thập dữ liệu.

Hướng dẫn

100 XP
  • Dùng ols() để .fit() một mô hình với data=df_monthly và formula="Close ~ DayCount".
  • Dùng model_fit.predict() trên cả df_monthly.DayCount và df_daily.DayCount để dự đoán giá Close theo tháng và theo ngày, rồi lưu vào cột mới Model trong mỗi DataFrame.
  • Gọi hàm dựng sẵn plot_model_with_data hai lần, cho mỗi df_monthly và df_daily, rồi so sánh các giá trị RSS hiển thị.