1. Learn
  2. /
  3. Courses
  4. /
  5. Pythonで学ぶサンプリング

Connected

Exercise

pandas での単純サンプリング

この章を通して、Spotify の楽曲データを探索していきます。母集団データセットでは各行が1曲を表し、行数は4万件以上あります。列には曲名、アーティスト、リリース年に加えて、再生時間、テンポ、ダンサビリティなどの属性が含まれます。まずは再生時間に注目しましょう。

最初のタスクは、Spotify データセットからサンプルを抽出し、母集団とサンプルの平均再生時間を比較することです。

spotify_population が利用可能で、pandas は pd として読み込まれています。

Instructions 1/2

undefined XP
    1
    2
  • spotify_population から 1000 行をサンプリングし、spotify_sample に代入します。