1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶ統計入門

Connected

演習

平均の平均

各案件あたりのユーザー数(num_users)の平均を知りたいとします。会社全体の平均を把握して、Amir の案件が会社の平均的な案件よりユーザー数が多いか少ないかを確認したいのです。問題は、過去 1 年間で会社は 1 万件以上の案件に取り組んでおり、すべてのデータを集計するのは現実的ではないことです。そこで、会社全体からデータを集める代わりに、いくつかの案件を無作為にサンプリングして平均を推定します。この方法ならはるかに簡単です。

amir_deals が利用可能で、会社のすべての案件のユーザーデータは all_deals にあります。pandas は pd、numpy は np として読み込まれています。

指示

100 XP
  • 乱数シードを 321 に設定します。
  • all_deals['num_users'] から、サイズ 20 の標本を(復元抽出で)30 回取り、それぞれの標本平均を計算します。標本平均は sample_means に保存します。
  • sample_means の平均を出力します。
  • amir_deals の num_users 列の平均を出力します。