1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Học có giám sát với scikit-learn

Connected

Bài tập

Tạo đặc trưng

Trong chương này, bạn sẽ làm việc với bộ dữ liệu tên là sales_df, chứa thông tin chi tiêu cho các chiến dịch quảng cáo trên các kênh truyền thông khác nhau và số tiền doanh thu (USD) tạo ra từ chiến dịch tương ứng. Bộ dữ liệu đã được tải sẵn cho bạn. Dưới đây là hai hàng đầu tiên:

     tv        radio      social_media    sales
1    13000.0   9237.76    2409.57         46677.90
2    41000.0   15886.45   2913.41         150177.83

Bạn sẽ dùng chi tiêu quảng cáo làm các đặc trưng để dự đoán doanh số, trước hết làm việc với cột "radio". Tuy nhiên, trước khi dự đoán, bạn cần tạo mảng đặc trưng và mục tiêu, và đưa chúng về đúng định dạng cho scikit-learn.

Hướng dẫn

100 XP
  • Tạo X, một mảng các giá trị từ cột "radio" của DataFrame sales_df.
  • Tạo y, một mảng các giá trị từ cột "sales" của DataFrame sales_df.
  • Đưa X về mảng NumPy hai chiều.
  • In hình dạng (shape) của X và y.