1. Lära sig
  2. /
  3. Courses
  4. /
  5. Python으로 살펴보는 표본추출(Sampling)

Connected

exercise

표본의 결과를 일반화할 수 있을까요?

방금 편의 표집—가장 쉬운 방법으로 데이터를 수집하는 것—이 모집단을 대표하지 않는 표본을 만들 수 있다는 점을 보셨습니다. 이는 곧, 표본에서의 발견을 모집단에 일반화할 수 없다는 뜻이기도 합니다. 모집단과 표본의 분포를 시각화하면 표본이 모집단을 대표하는지 여부를 판단하는 데 도움이 됩니다.

Spotify 데이터셋에는 acousticness 열이 있는데, 이는 트랙이 전원을 연결하지 않는 악기로 만들어졌는지에 대한 0에서 1 사이의 신뢰도 지표입니다. 전체 곡 모집단의 acousticness 분포와 일부 곡을 뽑은 표본의 분포를 비교해 보겠습니다.

spotify_population과 spotify_mysterious_sample이 준비되어 있고, pandas는 pd, matplotlib.pyplot은 plt, numpy는 np로 불러와져 있습니다.

Instruktioner 1 / 3

undefined XP
    1
    2
    3
  • pandas의 .hist()를 사용해 spotify_population의 acousticness에 대해 0부터 1까지 폭이 0.01인 구간을 갖는 히스토그램을 그리세요.