1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Chinh phục cuộc thi Kaggle bằng Python

Connected

Bài tập

Các đặc trưng theo ngày giờ

Bạn đã xây dựng một số đặc trưng cơ bản từ các biến số. Giờ là lúc tạo đặc trưng dựa trên ngày giờ. Bạn sẽ thực hành trên một mẫu con từ dữ liệu cuộc thi Taxi Fare Prediction trên Kaggle. Dữ liệu mô tả thông tin về các chuyến taxi và mục tiêu là dự đoán giá cho từng chuyến.

Mục tiêu của bạn là sinh các đặc trưng ngày giờ từ thời điểm đón khách (pickup datetime). Hãy nhớ rằng tốt hơn nên tạo đặc trưng mới cho cả dữ liệu train và test cùng lúc. Sau khi tạo xong, hãy tách dữ liệu trở lại thành các DataFrame train và test. Ở đây việc này được thực hiện bằng phương thức isin() của pandas.

Các DataFrame train và test đã có sẵn trong không gian làm việc của bạn.

Hướng dẫn

100 XP
  • Nối hai DataFrame train và test thành một DataFrame duy nhất taxi.
  • Chuyển cột "pickup_datetime" sang đối tượng datetime.
  • Tạo các đặc trưng thứ trong tuần (dùng thuộc tính .dayofweek) và giờ (dùng thuộc tính .hour) từ cột "pickup_datetime".