1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶMachine Learningによる時系列データ解析

Connected

演習

外れ値の扱い

この演習では、外れ値(ほかのデータと大きく異なるため、いわゆる「通常の」データとは異なる扱いをするデータ点)を処理します。前の演習で求めた(時間に対する)パーセント変化を用いて外れ値を検出します。まずは、時系列全体の中央値で外れ値を置き換える関数を作成します。

指示

100 XP
  • 入力の Series を受け取り、次を行う関数を定義してください。
    • 各データ点について系列の平均からの距離の絶対値を計算し、平均から標準偏差の3倍を超えるデータ点のブールマスクを作成します。
    • このブールマスクを使って、外れ値を系列全体の中央値に置き換えます。
  • この関数をデータに適用し、与えられたコードで結果を可視化してください。