1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Bảo mật dữ liệu và Ẩn danh trong Python

Connected

Bài tập

Khái quát hóa thành các khoảng

K-anonymity có thể là một mô hình bảo mật phù hợp cho các bộ dữ liệu không có quá nhiều chiều. Hai kỹ thuật ẩn danh chính để biến một bộ dữ liệu thành bảng k-ẩn danh là khái quát hóa (generalization) và lược bỏ (suppression).

Trong bài tập này, bạn sẽ biến đổi một bộ dữ liệu đánh giá mức độ hài lòng thành một bảng 3-ẩn danh chứa các thuộc tính nhạy cảm tiềm ẩn như satisfaction_rate và work_hours. Một số tổ hợp xuất hiện ít hơn ba lần. Hãy khắc phục điều đó để DataFrame đạt 3-ẩn danh.

DataFrame có sẵn dưới tên employees. Giá trị k bằng 3 cũng đã được cung cấp.

Hướng dẫn 1/3

undefined XP
    1
    2
    3
  • Tính xem có bao nhiêu tổ hợp duy nhất của birth_year và department.
  • Dùng .reset_index() và đặt tên cho cột mới sẽ chứa số đếm là count bằng cách truyền nó vào tham số name.