1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 시작하는 통계학

Connected

연습 문제

확률분포 만들기

몇 달 전 새 레스토랑이 문을 열었고, 경영진은 가장 자주 방문하는 고객 그룹의 크기에 맞춰 좌석 공간을 최적화하고자 합니다. 어느 날 저녁, 레스토랑에는 자리를 기다리는 10개 그룹이 있습니다. 그런데 이 그룹들은 도착한 순서대로 안내받는 것이 아니라 무작위로 호출됩니다. 이번 연습 문제에서는 크기가 서로 다른 그룹이 가장 먼저 선택될 확률을 살펴보겠습니다. 각 10개 그룹에 대한 데이터는 restaurant_groups DataFrame에 담겨 있습니다.

가능한 각 결과에 해당 확률을 곱한 뒤 모두 더해 기댓값을 계산할 수 있다는 점을 기억하세요. restaurant_groups 데이터가 제공되어 있습니다. pandas는 pd로, numpy는 np로, matplotlib.pyplot은 plt로 로드되어 있습니다.

지침 1/4

undefined XP
  • 1
    • restaurant_groups의 group_size 열로 히스토그램을 만들고, bins를 [2, 3, 4, 5, 6]으로 설정하세요. 그래프를 표시하는 것도 잊지 마세요.
  • 2
    • restaurant_groups에서 각 group_size의 개수를 센 뒤, restaurant_groups의 행 개수로 나누어 각 크기의 그룹을 무작위로 선택할 확률을 계산하세요. 결과는 size_dist로 저장하세요.
    • size_dist의 인덱스를 재설정하세요.
    • size_dist의 열 이름을 group_size와 prob로 변경하세요.
  • 3
    • size_dist의 기댓값, 즉 예상 그룹 크기를 계산하려면 group_size와 prob를 곱한 뒤, 그 값을 모두 더하세요.
  • 4
    • 그룹 크기가 4명 이상인 그룹만 추출한 뒤, 해당 그룹들의 선택 확률을 모두 더해 무작위로 4명 이상인 그룹을 선택할 확률을 계산하세요.