1. Nauka
  2. /
  3. Kursy
  4. /
  5. Prywatność danych i anonimizacja w Pythonie

Connected

ćwiczenie

Histogramy z prywatnością różnicową

W tym ćwiczeniu skorzystasz ze zbioru danych Heart Failure Prediction, stosując podejście oparte na prywatności różnicowej. Wygenerujesz i przeanalizujesz prywatne oraz nieprywatne histogramy, a następnie je porównasz.

Skupisz się na histogramach zmiennej age z tego zbioru danych. Choć w konsoli masz dostęp do niezmienionego DataFrame'a, w rzeczywistości nie udostępniałoby się go bez dodania szumu losowego obliczonego metodą prywatności różnicowej według podejścia globalnego.

DataFrame jest wczytany jako heart_df, natomiast obiekt Series zawierający wartości zmiennej age jest przechowywany jako ages. Moduł tools z biblioteki diffprivlib jest już zaimportowany.

Instrukcje 1/3

undefined XP
  • 1
    • Wygeneruj histogram numpy na podstawie danych ages.
    • Znormalizuj liczności, aby uzyskać proporcje.
    • Narysuj histogram, korzystając z proporcji.
  • 2
    • Wygeneruj prywatny różnicowo histogram danych ages, używając modułu tools.
    • Oblicz proporcje.
    • Narysuj histogram.
  • 3
    • Wygeneruj prywatny różnicowo histogram danych ages z parametrem epsilon równym 0.4.
    • Oblicz proporcje.
    • Narysuj histogram.