1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 배우는 실험 설계

Connected

연습 문제

실험 데이터 블로킹

여러분은 노동 생산성에 대한 실험을 진행하려는 한 제조업체와 함께 일하고 있어요. 데이터셋은 100행뿐이라, 실험 집단의 균형을 맞추는 것이 중요해요.

이럴 때 블로킹 지식이 큰 도움이 되겠죠. 제공된 productivity_subjects DataFrame을 사용해 주세요. 주어진 데이터셋을 각각 50개 항목으로 이루어진 두 개의 동일한 그룹으로 분할하세요.

라이브러리 numpy와 pandas는 각각 np, pd로 임포트되어 있어요.

지침

100 XP
  • productivity_subjects DataFrame에서 복원 추출 없이 임의로 50명을 선택해 새로운 DataFrame block_1을 만드세요.
  • block_1 DataFrame에 새 열 block을 추가하고 값을 1로 설정하세요.
  • 남은 대상들을 block_2라는 DataFrame에 넣고, 이 DataFrame의 block 열 값을 2로 설정하세요.
  • 두 블록(DataFrame)을 하나로 이어 붙인 뒤, 블로킹이 제대로 되었는지 확인하기 위해 block 열의 각 값에 대한 개수를 출력하세요.