1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶマーケティングのための機械学習

Connected

演習

変数の歪度を補正する

これから wholesale の各列に対して Box-Cox 変換を行い、その後、ペア関係プロットで確認して分布の歪度が小さくなり、より正規分布に近づいているかを確かめます。これは、K-means アルゴリズムがきちんと収束し、観測値を同質なグループ(クラスター/セグメント)に見つけ分けるための重要なステップです。

stats モジュールは scipy ライブラリから読み込まれており、wholesale データセットは pandas のDataFrameとしてインポートされています。

指示

100 XP
  • pandas のDataFrameに適用できるカスタムの Box-Cox 変換関数を定義します。
  • その関数を wholesale データセットに適用します。
  • 変換後の変数同士のペア関係をプロットします。
  • チャートを表示します。