1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶ仮説検定

Connected

演習

標本サイズの検定

仮説検定を公正に実施するには、標本が次の3つの条件を満たす必要があります:母集団からの無作為抽出であること、観測が互いに独立であること、そして観測数が十分に多いことです。このうち、コードで容易に検証できるのは最後の条件のみです。

必要な最小標本サイズは、実施したい仮説検定の種類によって異なります。ここでは、late_shipments データセットを使っていくつかのケースを確認します。

pandas の .all() メソッドは、すべての要素が True かどうかを確認するのに使えます。たとえば数値のエントリを持つ DataFrame df について、すべての要素が 5 未満かは (df < 5).all() のように確認できます。

late_shipments は利用可能で、pandas は pd として読み込まれています。

指示1 / 4

undefined XP
  • 1
    • late_shipments の freight_cost_group 列について、各値の出現数を取得します。
    • 二標本 t 検定に十分な件数かどうかを確認するため、適切なしきい値の数値を入力します。
  • 2
    • late_shipments の late 列について、各値の出現数を取得します。
    • 1標本の比率検定に十分な件数かどうかを確認するため、適切なしきい値の数値を入力します。
  • 3
    • vendor_inco_term ごとにグループ化した late_shipments の freight_cost_group 列について、各値の出現数を取得します。
    • カイ二乗の独立性検定に十分な件数かどうかを確認するため、適切なしきい値の数値を入力します。
  • 4
    • late_shipments の shipment_mode 列について、各値の出現数を取得します。
    • ANOVA に十分な件数かどうかを確認するため、適切なしきい値の数値を入力します。