1. Learn
  2. /
  3. Courses
  4. /
  5. Rで学ぶサンプリング

Connected

Exercise

標本からの発見は一般化できますか?

先ほど、利便抽出――最も簡単な方法でデータを集める――が、母集団全体を代表しない標本につながる可能性があることを確認しました。言い換えると、標本から得た結果は母集団全体へ一般化できないことがあります。母集団と標本の分布を可視化することで、標本が母集団を代表しているかどうかを判断しやすくなります。

Spotify のデータセットには acousticness という列があり、トラックがアコースティックかどうかを 0 から 1 の範囲で示す信頼度です。ここでは、全曲の母集団における acousticness と、その一部を抽出した標本における acousticness を見比べます。

spotify_population と spotify_mysterious_sample が利用可能で、dplyr と ggplot2 は読み込まれています。

Instructions 1/3

undefined XP
    1
    2
    3
  • spotify_population を使って、acousticness のヒストグラムを binwidth を 0.01 にして描画します。