1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Giám sát Machine Learning bằng Python

Connected

Bài tập

Tải và chia tách dữ liệu

Để triển khai và giám sát một mô hình trong môi trường production, trước hết bạn phải tạo ra mô hình đó. Trong video trước, bạn đã được giới thiệu cách tải và xử lý dữ liệu, xây dựng mô hình, và tạo các tập reference và analysis.

Trong bài tập này, bạn sẽ làm theo quy trình tương tự, nhưng để đơn giản, bạn sẽ dùng bộ dữ liệu NYC Green Taxi được cung cấp dưới dạng tệp csv đã được xử lý sẵn.

Cho bài tập này, pandas đã được import với bí danh pd và sẵn sàng để bạn sử dụng.

Hướng dẫn 1/2

undefined XP
    1
    2
  • Gán green_taxi_dataset.csv cho biến dataset_name.
  • Dùng pd.read_csv() để tải dữ liệu.
  • Hiển thị phần đầu của dataset.