MulaiMulai sekarang secara gratis

Pendekatan validation set

Pada bab tentang regresi linear, Anda memasangkan model regresi linear yang menjelaskan bobot jantung kucing berdasarkan bobot tubuhnya. Pewawancara meminta Anda untuk mengevaluasi seberapa baik model Anda.

Untuk menjawabnya, Anda perlu menurunkan prediksi yang dapat dibandingkan dengan nilai sebenarnya. Dalam pendekatan validation set, Anda membagi data menjadi dua bagian.

Untuk itu, Anda dapat terlebih dahulu mengambil sampel misalnya 80% nomor baris. Gunakan nomor baris terpilih untuk membuat subset himpunan latih. Sisa data frame dapat digunakan untuk pengujian.

Ingat bahwa:

rows <- c(1, 3)
df[-rows, ]

melakukan subset selain baris pertama dan ketiga.

Himpunan data cats tersedia di lingkungan Anda.

Latihan ini adalah bagian dari kursus

Latihan Pertanyaan Wawancara Statistik di R

Lihat Kursus

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

set.seed(123)

# Generate train row numbers
train_rows <- ___(nrow(___), round(0.8 * ___(cats)))
Edit dan Jalankan Kode