1. Learn
  2. /
  3. Courses
  4. /
  5. Pythonで学ぶ中級予測分析

Connected

Exercise

ウィンザー化で外れ値を処理する

"sum\_donations" と "donor\_id" の2つの変数を持つ basetable が与えられています。寄付額が極端に大きい寄付者がいると、"sum_donations" には外れ値が含まれる可能性があります。そこで、この変数をウィンザー化し、上位5%の金額を上位5%のパーセンタイル値で置き換えたいとします。

Instructions

100 XP
  • sum_donations の最小値を表示し、少なくとも0であることを確認してください。次に sum_donations の最大値を表示します。
  • 適切な下側のパーセンタイルの下限を入力してください。0より大きい値は現実的で頻繁に発生するため、下側のパーセンタイル未満の値を置き換える必要はありません。
  • 「sum_donations」変数をウィンザー化した新しい変数「sum_donations_winsorized」を作成します。
  • sum_donations_winsorized の最大値を表示してください。