1. Learn
  2. /
  3. Courses
  4. /
  5. Rによる推測の基礎

Connected

Exercise

ランダム化の密度

100回の反復は、置換(permute)の仕組みを理解するには十分ですが、帰無仮説下の比率差がとりうる代表的な値の全体像を見るには不十分です。

推測(推論)の4つのステップを思い出してください。これは本コースおよび今後の統計的推論のコースで使う共通の4ステップです。関数名を手がかりに、分析手順を思い出しましょう。

  • specify は応答変数と説明変数を指定します。
  • hypothesize は帰無仮説を宣言します。
  • generate は再標本化・置換・シミュレーションを行います。
  • calculate は要約統計量を計算します。

この演習では、このプロセスを1000回繰り返して、帰無仮説下の比率差の分布の全体像をつかみます。

Instructions

100 XP

dplyr、ggplot2、NHANES、infer パッケージは読み込まれています。

  • infer の構文を用いて HomeOwn 変数をシャッフルし、比率差を1000個生成します。infer の構文は次のとおりです。
    • 関心のある関係が HomeOwn と Gender であり、成功(success)が持ち家であることを success = "Own" として specify します。
    • null = "independence"(性別と持ち家の有無が無関係であること)という帰無を hypothesize します。
    • 置換を1000回 generate します。reps を 1000 に設定します。
    • stat = "diff in props" の統計量を calculate し、順序は c("male", "female") とします。
  • 密度プロットのコードを実行して、差の分布を平滑化した可視化を作成します。曲線はどのような形になりますか?