60/40 に分割してみましょう

ビデオで見たとおり、この章では Sonar データセットを使い、学習用に 60%、テスト用に 40% を使います。確実に身につけるために、もう一度 train/test の分割を練習しましょう。データセットの行インデックスをランダムに並べ替えるには sample() 関数が使えます。train/test 分割の際に利用できます。例:

n_obs <- nrow(my_data)
permuted_rows <- sample(n_obs)

そして、これらの行インデックスを使ってデータセットをランダムな順序に並べ替えます。例:

my_data <- my_data[permuted_rows, ]

データセットをランダムに並べ替えたら、先頭の 60% を学習用、末尾の 40% をテスト用に分割できます。

Sonar の観測数（行数）を取得し、n_obs に代入します。
Sonar の行インデックスをシャッフルして、permuted_rows に保存します。
permuted_rows を使って Sonar の行をランダムに並べ替え、Sonar_shuffled として保存します。
60/40 分割に適切な分割位置の行番号を求め、split に保存します。
Sonar_shuffled の先頭 60% を学習用データとして保存します。
Sonar_shuffled の末尾 40% をテストデータとして保存します。

แบบฝึกหัด

60/40 に分割してみましょう

คำแนะนำ

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}แบบฝึกหัด

คำแนะนำ

แบบฝึกหัด