1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶ一般化線形モデル

Connected

演習

線形モデルと二値の目的変数

動画では、二値の目的変数に線形モデルを当てはめる例と、そこからどのような問題がすぐに起こるかを見ました。直線に当てはめると、得られる予測値 \(\hat{y}\) が 0 と 1 の値を取るという問題設定の整合性から外れてしまうことを学びました。

あらかじめ読み込まれている crab データセットを使い、GLM の枠組みで y を x の関数としてモデル化し、この影響を確認します。

GLM のモデル定義は次のとおりです:

glm(formula = 'y ~ X', data = my_data, family = sm.families.____).fit()

ここで指定するのは formula、data、family です。

また、次のことも思い出してください:

  • Gaussian ファミリーの GLM は線形モデル(GLM の特殊例)です
  • Binomial ファミリーの GLM はロジスティック回帰モデルです。

指示

100 XP
  • crab データセットを使い、y を width で予測するようにモデルの formula を定義します。
  • GLM の式で線形モデルを当てはめるには、family 引数に Gaussian() を指定します。これは y が連続で概ね正規分布に従うと仮定します。
  • GLM の式でロジスティックモデルを当てはめるには、family 引数に Binomial() を指定します。
  • 適切な引数で glm() によりモデルを当てはめ、print() と summary() を使って当てはめたモデルのサマリーを確認します。