1. 学习
  2. /
  3. 课程
  4. /
  5. Pythonで学ぶデータプライバシーと匿名化

Connected

练习

分類用データセットの生成

望む条件の組み合わせをすべて満たす実データセットを見つけるのは難しく、たとえ収集できてもプライバシーの懸念が生じることがあります。そこで、データセットジェネレータを使って、実データに近い特性を持つデータを作成できます。

この演習では、3クラスの分類問題に対して大規模なデータセットを作成します。生成したデータを散布図で簡単に可視化できるよう、plot_data_points() というカスタム関数が用意されています。

说明

100 XP
  • 分類データセットを生成するために、sklearn.datasets から該当する関数をインポートします。
  • 5000 サンプル、4 特徴量、クラスあたり 1 クラスタ、3 クラス、クラス間分離 2 で生成します。
  • 生成したデータの形状を出力します。
  • 結果の散布図を確認します。