1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 하는 통계적 사고 (2부)

Connected

연습 문제

치환 표본 생성하기

영상에서, 치환 표본(permutation sampling)은 두 변수가 동일한 확률분포를 가진다는 가설을 모의 실험하는 훌륭한 방법이라고 배웠습니다. 이는 자주 검정하게 되는 가설이므로, 이번 연습에서는 두 데이터 세트로부터 치환 표본을 생성하는 함수를 작성해 보겠습니다.

기억하세요. 각각 n1, n2개의 원소를 가진 두 배열의 치환 표본은 다음과 같이 만듭니다. 두 배열을 이어 붙인 뒤(concatenate), 결합한 배열의 원소들을 무작위로 섞고, 처음 n1개의 원소를 첫 번째 배열의 치환 표본으로, 마지막 n2개의 원소를 두 번째 배열의 치환 표본으로 취합니다.

지침

100 XP
  • np.concatenate()를 사용해 두 입력 배열을 하나로 결합하세요. data1과 data2를 하나의 인수 (data1, data2)로 전달해야 합니다.
  • np.random.permutation()을 사용해 결합한 배열을 무작위로 섞으세요.
  • permuted_data의 처음 len(data1)개의 원소를 perm_sample_1에, 마지막 len(data2)개의 원소를 perm_sample_2에 저장하세요. 실무에서는 슬라이싱 :len(data1)와 len(data1):를 사용해 permuted_data를 나누면 됩니다.
  • perm_sample_1과 perm_sample_2를 반환하세요.