1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Pythonで学ぶ予測分析入門

Connected

Bài tập

特定の変数の離散化

連続変数で予測因子インサイトグラフを作成するには、まずその変数を離散化する必要があります。Python では、pandas の qcut メソッドを使って列を離散化できます。

変数がうまく離散化できているかを確認するには、groupby メソッドでビンのサイズが等しいかを検証します。

print(basetable.groupby("discretized_variable").size()

Hướng dẫn

100 XP
  • qcut メソッドを使って、time_since_last_donation を 10 個のグループに離散化し、その結果を新しい列 "bins_recency" に代入してください。
  • groupby メソッドを使って、ビンのサイズがおおむね等しいことを確認してください。