1. 学ぶ
  2. /
  3. コース
  4. /
  5. Python を使った統計学入門

Connected

演習

平均の平均

1件あたりの平均ユーザー数(num_users)を把握したいとします。ただし、Amirの案件のユーザー数が会社全体の平均と比べて多いか少ないかを確認するために、会社全体の数値が必要です。しかし、過去1年間で会社が手がけた案件は1万件以上あるため、すべてのデータを集めることは現実的ではありません。そこで、会社全体からデータを収集する代わりに、複数のランダムサンプルを使って平均を推定しましょう。

amir_deals は利用可能で、会社のすべての案件のユーザーデータは all_deals に格納されています。また、pandas は pd、numpy は np としてインポート済みです。

指示

100 XP
  • 乱数シードを 321 に設定してください。
  • all_deals['num_users'] からサイズ20のサンプルを(復元抽出で)30回取得し、各サンプルの平均を計算してください。サンプルの平均値を sample_means に格納してください。
  • sample_means の平均を出力してください。
  • num_users の amir_deals 列の平均を出力してください。