1. 学ぶ
  2. /
  3. コース
  4. /
  5. R による階層モデルと混合効果モデル

Connected

演習

メリーランド州の犯罪データを可視化する

モデルを当てはめる前にデータをプロットして、傾向や気になる点、外れ値の有無、今後検討が必要な特徴を「目で見る」ことは有用です。 ggplot2 を使うと、郡ごとに線を描き、時間の経過に伴う犯罪の変化を確認できます。 この演習では、メリーランド州の犯罪データ(md_crime)を見ていきます。これには Year、郡における暴力的な Crime の件数、そして County 名が含まれます。

このデータを探索するため、まず各郡のデータ点を時系列でプロットしましょう。そうすることで、各郡が時間とともにどのように変化しているかを確認できます。ここでは郡数が多く色分けでは見分けにくいため、color のような美的属性ではなく group を使います。生データをプロットしたら、各郡のトレンドラインも追加します。

ポイントを結ぶ線(geom_line)とトレンドライン(geom_smooth)は、どのような種類のランダム効果が必要か(もしあれば)を考えるヒントになります。すべての点の範囲や平均が似ているようであれば、ランダム効果の切片は重要でないかもしれません。同様に、郡間で傾向が一貫している(つまり、グループ間でトレンドラインが似ている、または平行に見える)場合は、ランダム効果の傾きは不要かもしれません。

指示1 / 2

undefined XP
    1
    2
  • md_crime データを使い、各 County(group 変数)における Year(x 変数)に対する Crime(y 変数)の変化をプロットしてください。
  • 各郡のトレンドラインを geom_smooth(method = 'lm', se = FALSE) で追加してください。se = FALSE にするとプロットが見やすくなります。