1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶデータプライバシーと匿名化

Connected

演習

範囲への一般化

K-anonymity は、次元数が多くない特定のデータセットに有効なプライバシーモデルです。データセットを k-匿名テーブルに変換する際に用いられる主な匿名化手法は、一般化と抑制の2つです。

この演習では、満足度評価のデータセットを、satisfaction_rate や work_hours のようなセンシティブな属性を含む 3-匿名のテーブルに変換します。いくつかの組み合わせは 3 回未満しか現れません。DataFrame が 3-匿名になるように修正しましょう。

DataFrame は employees として利用できます。k の値は 3 とします。

指示1 / 3

undefined XP
    1
    2
    3
  • birth_year と department のユニークな組み合わせの数を計算します。
  • .reset_index() を使い、件数を保持する新しく生成された列に、パラメータ name の引数として count を指定して名前を付けます。