単純無作為抽出

母集団をサンプリングする最も簡単な方法は、すでに見たとおりです。これは「単純無作為抽出」（略して "SRS" と呼ばれることもあります）といい、各行が他のどの行とも同じ確率で選ばれるように、行を1つずつ無作為に選びます。

どの行がサンプルに含まれたかを見やすくするために、サンプルを取る前に行IDの列をデータセットに追加しておくと便利です。

この章では、IBMの架空の従業員離職（attrition）データセットを使ってサンプリング手法を見ていきます。ここでの「attrition」は会社を離れることを意味します。