1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Bảo mật dữ liệu và Ẩn danh trong Python

Connected

Bài tập

Xóa tên thật bằng faker

Trong bài tập này, bạn sẽ làm việc với bộ dữ liệu lương NBA năm 2018. Nếu dữ liệu này không công khai, sẽ có nguy cơ cao bị tấn công tái định danh. Ví dụ, vì chỉ có một "Aaron Brooks" chơi ở NBA, người ta có thể suy ra các thông tin nhạy cảm khác như mức lương chính xác mỗi năm của anh ấy. Bằng cách loại bỏ tên riêng khỏi bộ dữ liệu, bạn có thể tránh gây tổn hại tiềm ẩn cho những người có trong đó.

Phương thức .name() sẽ tạo tên ngẫu nhiên, bao gồm cả tên nữ. Bên cạnh đó, bạn cũng sẽ tạo danh sách tên chỉ thuộc một giới tính.

DataFrame đã được nạp với tên nba.

Hướng dẫn 1/3

undefined XP
  • 1
    • Import lớp Faker.
    • Khởi tạo bộ sinh faker là fake_data.
  • 2
    • Thay đổi tên cầu thủ NBA bằng phương thức faker .name(), với hàm lambda áp dụng lên cột player.
  • 3
    • Chỉ tạo tên nam.