1. Learn
  2. /
  3. Courses
  4. /
  5. Python cho người dùng R

Connected

Exercise

Dữ liệu gọn (Tidy data)

Tái cấu trúc (reshaping) dữ liệu có nhiều ứng dụng. Một ứng dụng quan trọng là chuyển từ định dạng thuận tiện cho phân tích dữ liệu sang định dạng thuận tiện cho báo cáo. Khái niệm này được mở rộng trong bài báo Tidy data của Hadley Wickham.

Dữ liệu ở định dạng gọn cũng giúp bạn thực hiện các phép nhóm (groupby) như đã thấy ở bài tập trước.

Trong bài tập này, bạn sẽ dùng melt() và .pivot_table() của pandas để chuyển dữ liệu từ dạng này sang dạng khác. Hãy nhớ rằng khi gọi .pivot_table() trên dữ liệu, bạn cũng cần gọi phương thức .reset_index() để nhận lại DataFrame như ban đầu.

Trước khi bắt đầu tái cấu trúc DataFrame airquality, hãy kiểm tra nó trong shell. Chúng tôi đã import pandas với bí danh pd.

Instructions 1/3

undefined XP
    1
    2
    3

Melt DataFrame airquality.