1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Mô phỏng Monte Carlo với Python

Connected

Bài tập

Khám phá với box plot

Hai định dạng phổ biến của DataFrame là dạng rộng (wide) và dạng dài (long). Ở dạng rộng, các biến khác nhau nằm ở các cột khác nhau, còn ở dạng dài, các biến được biểu diễn bởi hai cột đi cùng nhau (một cột tên biến và một cột giá trị tương ứng).

Phiên bản dạng dài của DataFrame rất hữu ích để tạo nhanh nhiều kiểu trực quan hóa, bao gồm boxplot mà bạn sẽ vẽ trong bài này sau khi chuyển df_diffs (đã được nạp sẵn) từ dạng rộng sang dạng dài.

pandas đã được nạp với tên pd, matplotlib.pyplot là plt, và Seaborn là sns.

Hướng dẫn

100 XP
  • Chuyển hai cột bmi và hdl (theo đúng thứ tự đó) của DataFrame df_diffs từ dạng rộng sang dạng dài; lưu DataFrame dạng dài là hdl_bmi_long và đặt tên cột chứa giá trị biến là y_diff.
  • Dùng boxplot để trực quan hóa kết quả của các bệnh nhân nằm ở tứ phân vị đầu tiên hoặc cuối cùng của các biến hdl và bmi.