1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Bảo mật dữ liệu và Ẩn danh trong Python

Connected

Bài tập

Chuẩn bị dữ liệu nhân viên để phát hành an toàn

Khi làm việc với dữ liệu thực, bạn cần đảm bảo không có cách nào lần ra hoặc làm lộ thông tin cá nhân của khách hàng hay bất kỳ ai khác. Trong bài tập này, bạn sẽ dùng phiên bản đơn giản hóa của bộ dữ liệu IBM HR Analytics Employee để luyện tập kỹ thuật ẩn (suppression) và khái quát hóa (generalization).

Để tránh rò rỉ thông tin về bộ dữ liệu, bạn sẽ thay tên các cột bằng số.

DataFrame đã được nạp dưới tên hr, hãy dùng console để khám phá. numpy đã được import là np.

Hướng dẫn 1/3

undefined XP
    1
    2
    3
  • Loại bỏ các giá trị duy nhất khỏi hr.
  • Tạo df_cleaned bằng cách loại bỏ các giá trị NaN khỏi df_dropped.