1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Python nâng cao

Connected

Bài tập

CSV sang DataFrame (1)

Đưa dữ liệu vào một dictionary rồi dựng DataFrame thì dùng được, nhưng không hiệu quả lắm. Nếu bạn phải xử lý hàng triệu quan sát thì sao? Khi đó, dữ liệu thường được lưu trong các tệp có cấu trúc cố định. Một trong các định dạng đó là tệp CSV, viết tắt của "comma-separated values".

Để nhập dữ liệu CSV vào Python dưới dạng Pandas DataFrame, bạn có thể dùng read_csv().

Hãy cùng khám phá hàm này với bộ dữ liệu cars giống như các bài trước. Lần này, dữ liệu có sẵn trong tệp CSV tên cars.csv. Tệp này nằm trong thư mục làm việc hiện tại, nên đường dẫn đơn giản chỉ là 'cars.csv'.

Hướng dẫn

100 XP
  • Để nhập tệp CSV bạn vẫn cần gói pandas: import dưới tên pd.
  • Dùng pd.read_csv() để nhập dữ liệu cars.csv thành một DataFrame. Lưu DataFrame này vào biến cars.
  • In cars ra. Mọi thứ có ổn không?