1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Bảo mật dữ liệu và Ẩn danh trong Python

Connected

Bài tập

Khám phá dữ liệu với bộ quản lý ngân sách quyền riêng tư

Các hệ thống khám phá dữ liệu áp dụng differential privacy phải quản lý một ngân sách quyền riêng tư để đo lượng riêng tư bị hao hụt qua nhiều truy vấn.

Trong bài tập này, bạn sẽ khám phá bộ dữ liệu IBM HR Analytics Employee Attrition & Performance đồng thời theo dõi ngân sách quyền riêng tư. Hãy nhớ rằng nếu một truy vấn vượt quá ngân sách đã đặt trong bộ quản lý, sẽ phát sinh lỗi.

Histogram là công cụ hữu ích để trực quan hóa dữ liệu theo cách đảm bảo differential privacy. Cú pháp giống với hàm tương ứng trong numpy, có thêm tham số epsilon.

Toàn bộ dữ liệu có trong hr và thuộc tính tuổi của nhân viên là ages. Một hàm tùy chỉnh đã được tạo và nạp sẵn là show_histogram() để vẽ biểu đồ như bạn đã làm trước đó trong khóa học.

Hướng dẫn

100 XP
  • Tạo một BudgetAccountant với epsilon bằng 1.5, dùng hàm khởi tạo tương ứng.
  • Tạo một histogram riêng tư từ cột ages với giá trị epsilon là 0.1.
  • Lấy và hiển thị giá trị trung bình riêng tư của ages, dùng epsilon là 0.9, và bounds từ 10 đến 100 dưới dạng một tuple.
  • In ra ngân sách quyền riêng tư còn lại cho hai truy vấn mới sau đó.