1. 学ぶ
  2. /
  3. コース
  4. /
  5. Rで学ぶ実験計画法

Connected

演習

どのローン目的の平均が異なる?

purpose_recode 以外に貸付額に影響しそうな要因を見る前に、purpose_recode の各水準の平均のどれが異なるかを確認しましょう。これは前の演習で触れた事後検定です。

ANOVA の結果は p 値が非常に小さく、統計的に有意でした。つまり、帰無仮説は棄却でき、少なくとも1つの平均が異なるという対立仮説を支持できます。では、どれが異なるのでしょうか?

ここでは Tukey の HSD 検定(Honest Significant Difference)を使います。R で Tukey の HSD 検定を行うには、TukeyHSD() を使います。

TukeyHSD(aov_model, "independent_variable_name", conf.level = 0.9)

これは、ある aov_model に対して特定の "independent_variable_name" について、信頼水準 90%(conf.level = 0.9)で Tukey の HSD 検定を実行します。

指示

100 XP
  • aov() を使って、purpose_recode ごとの funded_amnt を検討するモデルを作成し、purpose_aov として保存します。
  • TukeyHSD() を使って、信頼水準 0.95 で purpose_aov に対して Tukey の HSD 検定を実行し、tukey_output というオブジェクトに保存します。
  • broom パッケージ(読み込み済み)の tidy() で tukey_output を整形します。