クラスタリング用データセットの生成

合成データは完全に合法で、世界中のプライバシー関連の法律や規制要件を満たします。生データに代わる、プライバシーに配慮した有効な選択肢です。make_blobs() 関数を使うと、ガウス（正規）分布に従うデータ点を生成できます。

この演習では、15000 サンプルのデータセットを生成します。

numpy はすでに np としてインポート済みで、カスタム関数 plot_data_points() もこの演習用に用意されています。