1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Bảo mật dữ liệu và Ẩn danh trong Python

Connected

Bài tập

Top code và bottom code lương của Nhà Trắng

Top code và bottom code giúp ẩn các giá trị ngoại lai và giảm rủi ro nhận dạng mà vẫn giữ được tính hữu ích của dữ liệu.

Trong bài tập này, bạn sẽ dùng dữ liệu lương của Nhà Trắng (Mỹ) trong các năm 2019 và 2020. Hãy áp dụng kỹ thuật top và bottom cho cột salary.

Bạn sẽ bắt đầu bằng cách khám phá dữ liệu lương để thấy phần lớn giá trị nằm ở trung tâm của phân phối. Dựa trên việc khám phá này, bạn sẽ chọn các ngưỡng top và bottom hợp lý.

DataFrame đã được nạp với tên wh2020.

Hướng dẫn 1/4

undefined XP
    1
    2
    3
    4
  • Tạo một biểu đồ histogram để xem phân phối lương trong cột salary. Sử dụng các giá trị bin mặc định.