1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶサンプリング

Connected

演習

系統抽出は問題ない?

系統抽出には注意点があります。データがソートされていたり、行の並びに何らかのパターンや意味がある場合、得られる標本が母集団を代表しない可能性があります。行をシャッフルすればこの問題は解決しますが、その場合、系統抽出は単純無作為抽出と同等になります。

ここでは、問題の有無をどのように見極めるかを確認します。

attrition_pop が利用可能です。pandas は pd、matplotlib.pyplot は plt として読み込まれています。

指示1 / 3

undefined XP
    1
    2
    3
  • attrition_pop にインデックス列を追加し、結果を attrition_pop_id に代入します。
  • pandas の .plot() を使って、attrition_pop_id について index に対する YearsAtCompany の散布図を作成します。