1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶ統計入門

Connected

演習

確率分布を作成する

数か月前に新しいレストランがオープンし、経営陣はよく来店するグループの人数に合わせて座席配置を最適化したいと考えています。ある夜、着席待ちのグループが10組いますが、到着順ではなくランダムに呼ばれることになりました。この演習では、人数の異なるグループが最初に選ばれる確率を調べます。10組それぞれのデータは restaurant_groups DataFrame に含まれています。

期待値は、各起こりうる結果にその確率を掛けて合計することで計算できることを思い出してください。restaurant_groups のデータは利用可能です。pandas は pd、numpy は np、matplotlib.pyplot は plt として読み込まれています。

指示1 / 4

undefined XP
  • 1
    • restaurant_groups の group_size 列のヒストグラムを作成し、bins を [2, 3, 4, 5, 6] に設定します。プロットを表示するのを忘れないでください。
  • 2
    • restaurant_groups における各 group_size の件数を数え、restaurant_groups の行数で割って、各人数のグループをランダムに選ぶ確率を計算します。size_dist として保存します。
    • size_dist のインデックスをリセットします。
    • size_dist の列名を group_size と prob に変更します。
  • 3
    • size_dist の期待値、すなわち想定されるグループの平均人数を、group_size と prob を掛けて合計することで計算します。
  • 4
    • 人数が4人以上のグループに絞り込み、これらを選ぶ確率を合計して、4人以上のグループをランダムに選ぶ確率を計算します。