1. Nauka
  2. /
  3. Kursy
  4. /
  5. Pythonで学ぶ線形モデリング入門

Connected

ćwiczenie

2つに分かれる変動

距離と時間の2つのデータセットが与えられます。1つは非常に小さい速度、もう1つは大きい速度です。どちらも傾きの標準誤差は同じになる場合がありますが、傾き(「効果量」)の大きさに対して標準誤差(「不確かさ」)がどの程度かによって、モデル全体の R-squared は異なり得ます。

両方のデータセットを同じ座標上に散布図として描くと、その違いがはっきり分かります。傾きによる変動は、トレンドラインの周りのランダムな散らばりによる変動とは異なります。この演習では、2つのデータセットについて標準誤差と R-squared を計算し、比較することが目標です。

Instrukcje

100 XP
  • distances1 と distances2 の両方について、ols() モデルを構築し、fit() します。
  • 得られた model_1 と model_2 の .bse と 'times' キーを使って、各モデルから傾きの標準誤差を取り出します。
  • .rsquared 属性を使って、各モデルから R-squared の値を取り出します。
  • 得られた se_1、rsquared_1、se_2、rsquared_2 を表示し、見た目で比較します。