1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶ推測の基礎

Connected

演習

等分散

業界ごとにベンチャーキャピタル(VC)からの投資規模は異なります。しかし、VC 投資のサンプルを見て平均投資額にわずかな差があったとしても、その差が統計的に有意だと言えるのでしょうか?これはまさに ANOVA の出番です。ただし、ANOVA を使ううえで重要な前提のひとつは、すべてのグループ間で分散が等しいことです。この演習では、等分散の Levene 検定を用いてそれを確認します。

3 つの業界(Biotechnology、Enterprise Software、Health Care)の投資データを含む pandas の DataFrame investments_df が用意されています。pandas は pd、NumPy は np、Matplotlib は plt、そして SciPy の stats パッケージも読み込まれています。

指示

100 XP
  • investments_df から、与えられた列名を使って各 market の資金調達額のみを個別に抽出します。
  • 次の順序で等分散の Levene 検定を実行し、それぞれ statistic1、statistic2、statistic3 に対応させます。(i)Biotechnology と Enterprise Software、(ii)Biotechnology と Health Care、(iii)Enterprise Software と Health Care。
  • それぞれについて、等分散であるという帰無仮説が棄却されるかどうかを示すブール値を返します。