1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Python nâng cao

Connected

Bài tập

Từ dictionary sang DataFrame (1)

Pandas là một thư viện mã nguồn mở, cung cấp các cấu trúc dữ liệu hiệu năng cao, dễ dùng và các công cụ phân tích dữ liệu cho Python. Nghe rất hứa hẹn!

DataFrame là một trong những cấu trúc dữ liệu quan trọng nhất của Pandas. Về cơ bản, đó là cách lưu trữ dữ liệu dạng bảng, nơi bạn có thể gán nhãn cho cả hàng và cột. Một cách để tạo DataFrame là từ một dictionary.

Trong các bài tập tiếp theo, bạn sẽ làm việc với dữ liệu về phương tiện giao thông của nhiều quốc gia. Mỗi quan sát tương ứng với một quốc gia và các cột cung cấp thông tin về số lượng phương tiện trên đầu người, người dân lái xe bên trái hay bên phải, v.v.

Ba danh sách đã được định nghĩa trong script:

  • names, chứa tên các quốc gia có dữ liệu.
  • dr, một danh sách kiểu boolean cho biết người dân lái xe bên trái hay bên phải ở quốc gia tương ứng.
  • cpc, số lượng phương tiện cơ giới trên 1000 người ở quốc gia tương ứng.

Mỗi key của dictionary là một nhãn cột và mỗi value là một danh sách chứa các phần tử của cột đó.

Hướng dẫn

100 XP
  • Import pandas với bí danh pd.
  • Dùng các danh sách được định nghĩa sẵn để tạo một dictionary tên là my_dict. Sẽ có ba cặp key value:
    • key 'country' và value names.
    • key 'drives_right' và value dr.
    • key 'cars_per_cap' và value cpc.
  • Dùng pd.DataFrame() để chuyển dict của bạn thành một DataFrame tên cars.
  • In cars ra và xem nó “đẹp” thế nào.