1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Phân tích báo cáo tài chính bằng Python

Connected

Bài tập

Bù giá trị khuyết bằng phân vị

Trong bài tập này, bạn sẽ tiếp tục luyện cách bù (impute) giá trị khuyết. Khác với bài trước, lần này bạn sẽ dùng các phân vị thay cho giá trị trung bình để tính giá trị bù. Dùng phân vị là cách tốt để có các ước lượng thận trọng. Bù giá trị khuyết trong một cột bằng phân vị gồm các bước sau:

  • Loại bỏ các giá trị khuyết khỏi cột cần xử lý.
  • Sau đó tính, ví dụ phân vị thứ 70 của các số trong cột sau khi đã loại giá trị khuyết.
  • Giá trị “tệ 70%” (70th percentile worst value) phụ thuộc vào cột bạn đang tính phân vị:
    • Chẳng hạn, có nhiều tài sản là tốt, nên ít tài sản là xấu hơn. Vậy “giá trị tệ 70%” của tài sản thực chất chính là phân vị thứ 30 của tài sản.
    • Tương tự, nợ phải trả lớn là xấu. Vì vậy “giá trị tệ 70%” của nợ phải trả đơn giản là phân vị thứ 70 của nó.

pandas đã được nạp với bí danh pd và NumPy đã được nạp với bí danh np. Một DataFrame của pandas tên là dataset đã được cung cấp cho bạn. Nó có cột "Total Current Liabilities", trong đó có một số giá trị khuyết.

Hướng dẫn 1/2

undefined XP
    1
    2
  • Bù các giá trị khuyết trong "Total Current Liabilities" theo "company" bằng phân vị thứ 70 của các giá trị không khuyết.
  • Bù các giá trị khuyết trong "Total Current Liabilities" theo "comp_type" bằng phân vị thứ 70 của các giá trị không khuyết.