1. Учиться
  2. /
  3. Courses
  4. /
  5. Pythonで学ぶデータプライバシーと匿名化

Connected

Exercise

faker で名前を削除する

この演習では、2018年の NBA Salaries データセットを扱います。このデータが公開されていなければ、再識別攻撃のリスクが高いはずです。例えば、NBA に「Aaron Brooks」という選手は 1 人しかいないため、年俸など他の機微情報を特定されてしまう可能性があります。データセットから個人名を取り除くことで、対象者への潜在的な被害を防げます。

.name() メソッドは、女性名を含むランダムな名前を生成します。これに加えて、特定の性別のみの名前を作成する方法も試します。

nba という DataFrame はすでに読み込まれています。

Инструкции 1 / 3

undefined XP
  • 1
    • Faker クラスをインポートします。
    • faker のジェネレーターを fake_data として初期化します。
  • 2
    • player 列に lambda 関数を適用し、faker の .name() メソッドを使って NBA 選手の名前を置き換えます。
  • 3
    • 男性名のみを生成します。