MulaiMulai sekarang secara gratis

Cross-validation untuk R-squared

Cross-validation adalah pendekatan penting untuk mengevaluasi model. Metode ini memaksimalkan jumlah data yang tersedia bagi model, karena model tidak hanya dilatih tetapi juga diuji pada seluruh data yang tersedia.

Dalam latihan ini, Anda akan membangun model regresi linear, lalu menggunakan cross-validation 6-fold untuk menilai akurasinya dalam memprediksi penjualan berdasarkan pengeluaran iklan media sosial. Anda akan menampilkan skor individu untuk masing-masing dari enam fold.

Himpunan data sales_df telah dipisahkan menjadi y untuk variabel target dan X untuk fitur, dan sudah dimuat untuk Anda. LinearRegression telah diimpor dari sklearn.linear_model.

Latihan ini adalah bagian dari kursus

Supervised Learning dengan scikit-learn

Lihat Kursus

Petunjuk latihan

  • Impor KFold dan cross_val_score.
  • Buat kf dengan memanggil KFold(), tetapkan jumlah pembagian menjadi enam, shuffle ke True, dan atur seed sebesar 5.
  • Lakukan cross-validation menggunakan reg pada X dan y, teruskan kf ke cv.
  • Cetak cv_scores.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Import the necessary modules
from ____.____ import ____, ____

# Create a KFold object
kf = ____(n_splits=____, shuffle=____, random_state=____)

reg = LinearRegression()

# Compute 6-fold cross-validation scores
cv_scores = ____(____, ____, ____, cv=____)

# Print scores
print(____)
Edit dan Jalankan Kode