1. 学ぶ
  2. /
  3. コース
  4. /
  5. R による階層モデルと混合効果モデル

Connected

演習

lmerモデルの結果を表示する

データサイエンティストには成果を伝える力が求められます。DataCampにはこのテーマに関するコースもあります。 自分の分析を説明することで、相手は結果を理解しやすくなります。 そのためには、相手の知識レベルや期待に合わせて説明の仕方を調整しましょう。

非技術者向けには、出力から得られた重要な発見を平易に伝えます。たとえば、母親の年齢が高い郡では出生率が低い傾向があります のようにまとめます。 技術者向けには、係数推定値、信頼区間、検定統計量などの詳細を含めます。 回帰出力の記述方法については、The Chicago Guide to Writing about Multivariate Analysis のような書籍に有用な提案があります。

この演習では、固定効果を抽出して可視化します。係数は geom_point() で、95%信頼区間は geom_linerange() でプロットします。さらに、ゼロの位置を視覚化しやすくするために geom_hline() で赤い基準線を追加します。95%信頼区間にゼロが含まれなければ、その係数推定値はゼロと有意に異なると解釈できます。

ggplot では xmin や xmax が使えず、ymin と ymax のみ指定できるため、coord_flip() が必要です。また、theme_minimal() はデフォルトからテーマを変更します。

【技術メモ】lmer から回帰係数を抽出するのは少し難しく、lmer と broom の作者による議論が参考になります。

指示

100 XP
  • broom.mixed パッケージの tidy() を使って、モデル out から係数を抽出します。信頼区間も含めてください。
  • 既存のコードを使って、ランダム効果の推定値をフィルタで除外します。
  • 係数テーブルを画面に表示します。
  • ggplot2 で出力をプロットします。x軸に term、y軸に estimate、ymin に conf.low、ymax に conf.high を指定します。