1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Feature Engineering cho Machine Learning bằng Python

Connected

Bài tập

Làm quen với dữ liệu của bạn

Pandas là một trong những gói phổ biến nhất để làm việc với dữ liệu dạng bảng trong Python. Thông thường, nó được import với bí danh pd và có thể dùng để tải một tệp CSV (hoặc các tệp phân tách khác) bằng read_csv().

Bạn sẽ làm việc với một tập con đã được chỉnh sửa của dữ liệu phản hồi khảo sát Stackoverflow trong ba chương đầu của khóa học này. Bộ dữ liệu này ghi lại thông tin chi tiết và sở thích của hàng nghìn người dùng trang web StackOverflow.

Hướng dẫn 1/4

undefined XP
    1
    2
    3
    4
  • Import thư viện pandas với tên pd.
  • so_survey_csv chứa URL tới một tệp CSV. Dùng Pandas import tệp này vào so_survey_df.