1. 学ぶ
  2. /
  3. コース
  4. /
  5. R による Supervised Learning:回帰

Connected

演習

自転車レンタルの予測を可視化する

前の演習では、標準的な「実測値 vs 予測値」の散布図で自転車モデルの予測を可視化しました。自転車レンタルのデータは時系列なので、時間の経過に伴ってモデルがどう振る舞うかにも関心があるはずです。この演習では、8月の最初の14日間について、時間単位で予測と実測のレンタル数を比較します。

プロットを作成するために、tidyr::pivot_longer()(docs)を使って、bikesAugust にある予測値と実測値を1つの列にまとめます。pivot_longer() は次の引数を取ります。

  • ピボットする「ワイド」形式のデータフレーム(パイプで暗黙に渡されます)
  • 1つの列に集約する列の名前(キーワード "cols")
  • 作成されるキー列の名前 — 集約した列の名前を含みます(キーワード "names_to")
  • 作成される値列の名前 — 集約した列の値を含みます(キーワード "values_to")

このピボット後のデータフレームを使って、時間に対する実測と予測のレンタル数を比較します。時間インデックス instant は、データ収集開始からの観測番号を表します。サンプルコードでは、instant を0から始まる日単位に変換しています。

予測値(bikesAugust$pred)を含む bikesAugust データフレームは読み込まれています。

指示

100 XP
  • 空欄を埋めて、8月の最初の14日間について、時間ごとの予測値と実測値をプロットしてください。
    • instant を時間ではなく日単位になるように変換する
    • cnt と pred 列を pivot_longer() で、キー列を valuetype、値列を value という名前にまとめる
    • 8月の最初の2週間に filter() する
    • instant(日)に対する value をプロットする

モデルは、自転車レンタルの時間的なパターンをおおまかにつかめているでしょうか?