1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 살펴보는 표본추출(Sampling)

Connected

연습 문제

pandas로 간단히 샘플링하기

이 장에서는 Spotify의 노래 데이터를 살펴보게 됩니다. 이 모집단 데이터셋의 각 행은 한 곡을 나타내며, 40,000개가 넘는 행이 있습니다. 열에는 곡 이름, 참여 아티스트, 발매 연도, 그리고 재생 시간, 템포, 춤추기 적합도(danceability) 같은 곡의 속성이 포함되어 있습니다. 먼저 재생 시간을 살펴보겠습니다.

첫 번째 작업은 Spotify 데이터셋에서 샘플을 뽑아 모집단의 평균 재생 시간과 비교하는 것입니다.

spotify_population을(를) 사용할 수 있으며 pandas는 pd로 불러와져 있습니다.

지침 1/2

undefined XP
    1
    2
  • spotify_population에서 1000행을 샘플링하여 spotify_sample에 할당하세요.