1. Learn
  2. /
  3. Courses
  4. /
  5. Pythonで学ぶデータプライバシーと匿名化

Connected

Exercise

差分プライバシー付きヒストグラム

この演習では、差分プライバシーのアプローチに従って Heart Failure Prediction データセットにアクセスします。プライベートと非プライベートのヒストグラムを作成・分析し、比較します。

データセットの age 変数のヒストグラムに注目します。コンソールでは完全な DataFrame にアクセスできますが、実際にはグローバルアプローチに基づき、差分プライバシーで計算したランダムノイズを加えずに共有することはありません。

DataFrame は heart_df として読み込まれており、age の値を保持する Series は ages に格納されています。diffprivlib の tools はすでにインポート済みです。

Instructions 1/3

undefined XP
  • 1
    • ages から numpy のヒストグラムを作成します。
    • カウントを正規化して割合を求めます。
    • その割合を使ってヒストグラムを描画します。
  • 2
    • tools を使って ages の差分プライベートなヒストグラムを作成します。
    • 割合を求めます。
    • ヒストグラムを描画します。
  • 3
    • ages から、epsilon を 0.4 にして差分プライベートなヒストグラムを作成します。
    • 割合を求めます。
    • ヒストグラムを描画します。