1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶカスタマーセグメンテーション

Connected

演習

RFM データの前処理

以前に計算した RFM 値のデータセットを datamart_rfm として読み込んであります。変数には歪みがあり、スケールも異なるため、ここでは歪みを取り除いて正規化します。

pandas ライブラリは pd、numpy は np として読み込まれています。コンソールで datamart_rfm を少し探索してみてください。

指示

100 XP
  • 歪みを補正するために datamart_rfm に対して対数変換を適用し、datamart_log として保存してください。
  • StandardScaler() を scaler という名前で初期化し、datamart_log データに対して fit してください。
  • scaler を使って data をスケーリングとセンタリングで変換してください。
  • datamart_normalized から pandas の DataFrame を作成し、datamart_rfm の index と列名(columns)を設定してください。