1. Lära sig
  2. /
  3. Courses
  4. /
  5. Rで学ぶ時系列分析

Connected

exercise

欠損値

時系列データには欠損値が含まれることがあり、R では NA で表されます。どこに欠損があるかを把握することは有用です。また、R のさまざまな関数が欠損値をどのように扱うかを知ることも重要です。欠損を無視したい場合もあれば、欠損値を補完(推定)したい場合もあります。

ここでは再び月次の AirPassengers データセットを扱いますが、今回は 1956 年のデータが欠損しています。この演習では、この欠損が与える影響を確認し、問題解決のために新しいデータを補完してみます。

mean() 関数は標本平均を計算しますが、NA が含まれていると正しく動作しません。すべての欠損を除外して平均を計算するには、mean(___, na.rm = TRUE) を使います。観測された値の平均で欠損を置き換えるのは一般的な方法です。AirPassengers データセットにこの単純なデータ補完法を適用した場合、十分に妥当と言えるでしょうか。

Instruktioner

100 XP
  • plot() を使って AirPassengers の簡単なプロットを表示します。1956 年の欠損データに注目してください。
  • mean() を使って、欠損を除外して(na.rm = TRUE)AirPassengers の標本平均を計算します。
  • 事前に用意されたコードを実行して、欠損部分に平均値を補完します。
  • もう一度 plot() を呼び出して、補完後の AirPassengers データを再プロットします。
  • 事前に用意されたコードを実行して、完全な AirPassengers データをプロットに追加します。