1. 学ぶ
  2. /
  3. プロジェクト
  4. /
  5. ケーススタディ:Rで都市の時系列データを分析する

Connected

演習

Red Sox データのエンコードとプロット

フライト、天気、経済のデータを探索・加工してきましたが、クライアントは「全方位で」確認したいようです。そこで、ボストンの主要スポーツチーム、Boston Red Sox(野球)、New England Patriots(アメリカンフットボール)、Boston Bruins(アイスホッケー)、Boston Celtics(バスケットボール)のデータ収集を依頼されました。本章では、2010 年から 2015 年までの期間にこれらのチームが戦った全試合のスケジュールと結果データを準備します。時系列データの操作をさらに練習する絶好の機会です!

まずは、2010 年から 2015 年に Boston Red Sox が戦った試合のデータをまとめました。この演習では、データを確認し、xts にエンコードし、時間とともに変化する傾向をプロットします。redsox データフレームはワークスペースに用意されています。

指示

100 XP
  • summary() を使って、redsox データの要約統計量を確認してください。日付列に注意し、対応が必要な欠損値(NA)があるかどうかをチェックします。
  • redsox データを xts に変換できそうだと判断したら、as.Date() を用いて date 列を時刻ベースのオブジェクトにエンコードすることから始めます。
  • as.xts() で redsox データを xts に変換します。必ず order.by に date 列を指定してください。また、xts オブジェクトが数値型になるように、日付列は([, -1] 記法で)削除します。
  • plot.zoo() を使って、Red Sox の得点(boston_score)と対戦相手の得点(opponent_score)を時系列でプロットします。これらのプロットから、どのような傾向が読み取れますか?