1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶ推測の基礎

Connected

演習

カテゴリ変数における効果量

オースティン市の職員データでは、職種名ごとの性別分布に偏りがあることを見ました。同じことは人種・民族でも言えるのでしょうか。また、人種・民族は職種名の選択とどの程度関係しているのでしょうか。この演習では、その問いを深掘りして答えを出します。

職種名と人種・民族をクロス集計したDataFrame(employees_df)が読み込まれており、パッケージとしてpandasはpd、NumPyはnp、SciPyのstatsも用意されています。

指示1 / 2

undefined XP
    1
    2
  • 連関表employees_dfからカイ二乗統計量を計算します。
  • クラメールのVの自由度を計算します。
  • 連関表に含まれる人数の合計を計算します。
  • 動画で示した式を使ってクラメールのVを計算します。