가장 적합한 연속형 분포에서 샘플링하기

적합도가 높은 확률분포에서 무작위 샘플링을 하면 프라이버시를 지키면서도, 승인된 사용자들이 데이터를 정확하게 통계 분석할 수 있습니다.

이 연습 문제에서는 IBM 데이터셋의 monthly_income 열을 익명화해 보겠습니다. 이전 레슨에서 연속형 분포인 exponnorm이 가장 잘 맞는 것으로 확인했죠. 이를 사용해 소득을 모델링하세요.

데이터셋은 hr로 제공됩니다.