1. เรียนรู้
  2. /
  3. Courses
  4. /
  5. Pythonで学ぶマーケティングのための機械学習

Connected

Exercises

解約率の探索とデータ分割

Chapter 1 の概要を踏まえて、このレッスンでは、解約予測に Machine Learning を使うためのデータ準備をさらに深掘りします。まず解約の分布を確認し、モデリングに進む前にデータを学習用とテスト用に分割します。このステップで解約率の分布を把握し、学習データでモデルを構築し、未使用のテストデータで性能を評価できるように前処理します。

通信会社のデータセットは telcom という名前の pandas のDataFrameとして読み込まれています。目的変数の列名は Churn です。

คำแนะนำ

100 XP
  • Churn 列のユニークな値を表示します。
  • 各解約グループの比率(サイズ)を計算します。
  • データを学習用とテスト用に分割する関数をインポートします。
  • データを学習75%、テスト25%に分割します。