1. 学ぶ
  2. /
  3. コース
  4. /
  5. R によるカテゴリカルデータの推測

Connected

演習

適合度検定

適合度検定における帰無仮説は、各比率に対する具体的な母数の値の一覧です。今回の分析では、都市レベルの総得票数の先頭数字の分布にベンフォードの法則が当てはまる、という仮説に相当します。数式では次のように書けます。

$$ H_0: p_1 = .30, p_2 = .18, \ldots, p_9 = .05 $$

ここで、\(p_1\) はベンフォード分布の棒グラフにおける最初の棒の高さを表します。対立仮説は、これらの比率の少なくとも1つが異なる、すなわち先頭数字の分布がベンフォードの法則に従わない、というものです。

この演習では、シミュレーションを用いて、もし実際にこれらのカウントがベンフォードの法則に従っていた場合に観測されるようなカイ二乗統計量の帰無分布を作成します。

指示

100 XP
  • p_benford を画面に表示して中身を確認します。
  • iran から始めて、chisq_stat を使ってカイ二乗統計量を計算します。データフレーム内で応答となる変数と、比較対象となる確率ベクトルの両方を指定する必要がある点に注意してください。
  • point 帰無仮説の下で、比率ベクトル p を p_benford として、Chisq 統計量のサンプルを500回シミュレーションし、帰無分布を構築します。得られた統計量は null として保存します。