1. Learn
  2. /
  3. Courses
  4. /
  5. Python으로 배우는 실험 설계

Connected

Exercise

직원 블록 내 ANOVA

제조업체에서 진행했던 이전 분석을 바탕으로, 여러 블록에 걸쳐 근로자 생산성을 살펴보고 인센티브 프로그램을 도입했을 때의 효과를 더 깊이 탐색해 보려 합니다. 회사는 1200명의 추가 직원을 포함한 더 풍부한 데이터셋을 보유하고 있으며, 각 직원의 productivity_score가 productivity DataFrame에 포함되어 있습니다. 또한 생산성 수준에 따라 직원을 세 개의 블록으로 나누었고, 각 직원에게 세 가지 인센티브 옵션 중 하나인 'Bonus', 'Profit Sharing', 'Work from Home'을 무작위로 배정했습니다.

인센티브 처치가 생산성에 미치는 전체 효과를 평가하기 전에, 초기 처치 배정이 실제로 무작위이며 블록 간에 공정했는지 확인하는 것이 중요합니다. 이렇게 해야 이후에 관찰되는 생산성 차이가 블록 간의 기존 격차가 아니라 인센티브 프로그램 자체에 기인한다고 자신 있게 말할 수 있습니다.

scipy.stats의 f_oneway() 함수가 미리 로드되어 있습니다.

Instructions

100 XP
  • 데이터에서 서로 다른 블록을 나타내는 적절한 열을 기준으로 prod_df를 그룹화하세요.
  • 블록별로 ANOVA 검정을 적용하기 위해 lambda 함수를 사용하고, lambda 함수의 인자를 명시하세요.
  • 각 블록 내의 처치 그룹마다 'Treatment' 열 값을 기준으로 prod_df를 필터링하고 'productivity_score' 열을 선택하세요.