1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Chinh phục cuộc thi Kaggle bằng Python

Connected

Bài tập

Khám phá dữ liệu train

Bạn sẽ làm việc với một cuộc thi Kaggle khác có tên "Store Item Demand Forecasting Challenge". Trong cuộc thi này, bạn được cung cấp dữ liệu bán hàng theo cửa hàng-mặt hàng trong 5 năm và được yêu cầu dự đoán doanh số 3 tháng cho 50 mặt hàng khác nhau tại 10 cửa hàng khác nhau.

Bắt đầu nhé, hãy khám phá dữ liệu train của cuộc thi này. Để tăng tốc độ, bạn sẽ làm việc với một tập con của dữ liệu train chỉ chứa lịch sử của một tháng.

Mục tiêu ban đầu của bạn là đọc dữ liệu đầu vào và có cái nhìn đầu tiên về nó.

Hướng dẫn

100 XP
  • Import pandas dưới tên pd.
  • Đọc dữ liệu train bằng phương thức read_csv() của pandas.
  • In phần đầu của dữ liệu train (dùng phương thức head()) để xem mẫu dữ liệu.