1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Bảo mật dữ liệu và Ẩn danh trong Python

Connected

Bài tập

Lấy mẫu từ phân phối liên tục phù hợp nhất

Lấy mẫu ngẫu nhiên từ một phân phối xác suất phù hợp giúp bảo vệ quyền riêng tư. Đồng thời, nó vẫn cho phép các bên được cấp quyền thực hiện phân tích thống kê chính xác trên dữ liệu.

Trong bài tập này, bạn sẽ ẩn danh cột monthly_income từ bộ dữ liệu IBM. Ở bài học trước, bạn đã xác định phân phối liên tục exponnorm là phù hợp nhất. Hãy dùng nó để mô hình hóa thu nhập.

Bộ dữ liệu có sẵn dưới tên hr.

Hướng dẫn

100 XP
  • Import mô-đun stats từ gói scipy.
  • Fit phân phối exponnorm cho biến liên tục monthly_income để lấy các tham số của phân phối và sau đó tạo mẫu.
  • Lấy mẫu từ phân phối exponnorm và thay thế monthly_income bằng phương thức .rvs(). Chỉ định kích thước (size) bằng đúng độ dài của cột.
  • Làm tròn mức lương về số nguyên gần nhất.