範囲への一般化

K-anonymity は、次元数が多くない特定のデータセットに有効なプライバシーモデルです。データセットを k-匿名テーブルに変換する際に用いられる主な匿名化手法は、一般化と抑制の2つです。

この演習では、満足度評価のデータセットを、satisfaction_rate や work_hours のようなセンシティブな属性を含む 3-匿名のテーブルに変換します。いくつかの組み合わせは 3 回未満しか現れません。DataFrame が 3-匿名になるように修正しましょう。

DataFrame は employees として利用できます。k の値は 3 とします。